CONTRIBUTO DEL MACHINE LEARNING NELLA DIAGNOSI DELLE TELOMEROPATIE
View/ Open
Author
Arcuri, Luca <1991>
Date
2023-10-31Data available
2023-11-02Abstract
Le telomeropatie (TBD) sono malattie molto eterogenee caratterizzate da mutazioni germinali di geni coinvolti nell'omeostasi dei telomeri. La diagnosi può essere molto complessa.
Per ridurre tale difficoltà, abbiamo applicato il machine learning (ML) non supervisionato valutando in una coorte eterogenea di 140 pazienti con sintomi suggestivi di TBD l’esistenza di cluster specifici per TBD. Per ogni paziente, abbiamo valutato caratteristiche clinico-laboratoristiche e genetiche. I pazienti con genetica sconosciuta sono stati esclusi.
Abbiamo effettuato il ML ignorando la genetica ed escludendo le caratteristiche con più del 15% di dati mancanti. Con la silhouette analysis sono stati scelti quattro cluster, numerati da 1 a 4. Il clustering è stato effettuato con l’algoritmo K-means.
Abbiamo effettuato un'analisi "a posteriori" per identificare le caratteristiche associate a cluster specifici.
Abbiamo osservato che i geni correlati a TBD si sono distribuiti preferibilmente nei cluster 2 e 3 (p ≈ 0,0002) così come i geni patogenetici correlati a TBD (p = 0,0155).
I pazienti con TL <1° o <10° centile si sono significativamente associati ai cluster 2 e 3.
I pazienti con pneumopatia o neuropatia, categorie indipendenti perché escluse dall'analisi dei cluster per gli eccessivi dati mancanti, si sono associati al cluster 2 (p = 0,0355 e p = 0,0384 rispettivamente).
Le associazioni di caratteristiche non indipendenti come BMF ± epatopatia ± triade mucocutanea, BMF + epatopatia + immunodeficienza, epatopatia + immunodeficienza, triade mucocutanea + immunodeficienza, triade mucocutanea + autoimmunità, si sono distribuite prevalentemente nel cluster 2.
In conclusione, con il ML abbiamo identificato cluster specifici per TBD con caratteristiche tipiche, compresi TL < 10° centile e varianti patogenetiche legate a TBD, ma anche sintomi "meno" tipici, associati o meno, come epatopatia e immunodisregolazione. In pazienti con tali caratteristiche sono raccomandabili indagini per TBD. Telomere biology disorders (TBDs) are very heterogeneous diseases characterized by germline mutations in genes involved in telomere length (TL) homeostasis. Diagnosis of TBD may be very challenging.
To improve diagnostic work-up we used machine learning (ML) unsupervised analysis in a heterogeneous cohort of 140 patients with suggestive features of TBD, to determine whether specific clusters existed for TBD patients. For each patient, we evaluated clinical, biochemical and genetic features. Patients with an unknown genetic status were excluded. In ML analysis we excluded genetics (non-categorical variable) and features with more than 15% missing. After silhouette analysis, four clusters (1 to 4), were chosen as optimal. Clustering was performed using k-means.
We tried to identify patients’ features associated to specific clusters by an “a posteriori analysis”.
We observed that TBD related genes were preferentially distributed in cluster 2 and 3 (p≈0.0002) and so did TBD related pathogenic genes (p=0.0155).
Patients with TL <1st or <10th centile were significantly associated to clusters 2 and 3.
Patients with lung or neurological disease, excluded for excessive missing in cluster analysis, and for these strong, independent features, were associated to cluster 2 (p=0.0355 and p=0.0384 respectively).
Non-independent features combination such as BMF ± hepatopathy ± mucocutaneous triad, BMF + hepatopathy + immunodeficiency, hepatopathy + immunodeficiency, mucocutaneous + immunodeficiency, mucocutaneous + autoimmunity, were all prevalently distributed in cluster 2.
In conclusion by ML tool, we identified two clusters specific for TBD where prevailed some TBD clinical and genetic features, including TL < 10th centile and TBD related pathogenic variants but also “less” typical symptoms either alone or in combination as hepatic disease or immune dysregulation. It looks advisable that patients carrying these features undergo a full diagnostic work-up for TBD.