Mostra i principali dati dell'item
Previsione dell'Istologia delle Lesioni Mammarie a partire da Caratteristiche Radiomiche Utilizzando l'Apprendimento Automatico: Uno Studio di Caso Metodologico.
| dc.contributor.advisor | Piana, Michele <1966> | |
| dc.contributor.author | Rotolo, Giancarlo <2001> | |
| dc.date.accessioned | 2025-12-18T14:14:03Z | |
| dc.date.available | 2025-12-18T14:14:03Z | |
| dc.date.issued | 2025-12-16 | |
| dc.identifier.uri | https://unire.unige.it/handle/123456789/14301 | |
| dc.description.abstract | La tesi affronta la predizione dell’istologia delle lesioni mammarie tramite feature radiomiche in un dataset molto ridotto e sbilanciato (73 pazienti, 492 feature, 27,4% maligni). Gli approcci ML convenzionali mostrano limiti evidenti: la selezione delle feature non ha trovato predittori stabili e una Random Forest ottimizzata per AUC ha ottenuto una discriminazione discreta (AUC 0.763) ma sensibilità molto bassa (20%), indicando un forte bias verso i casi benigni. Tecniche per gestire lo sbilanciamento, come SMOTEENN, Focal Loss e stacking, hanno fornito risultati instabili. Per superare queste difficoltà è stata proposta l’architettura ibrida “Expert Committee.” Essa combina un Generalist ad alta sensibilità (ensemble di XGBoost, LightGBM e Regressione Logistica) con uno Specialist ad alta specificità (RF-RFECV), integrando le predizioni tramite un ensemble calibrato basato sull’accordo. La Nested Cross-Validation a 5 fold ha prodotto un profilo bilanciato: AUC 0.787, Sensibilità 0.700, Specificità 0.887. Il contributo principale è metodologico, offrendo una strategia più stabile per la radiomica a basso numero di campioni. | it_IT |
| dc.description.abstract | This thesis tackles the challenge of predicting breast lesion histology from radiomic features in a highly limited and imbalanced dataset (73 patients, 492 features, 27.4% malignant). Standard ML methods showed clear limits: robustness-based feature selection found no stable predictors, and a Random Forest optimized for AUC reached acceptable discrimination (AUC 0.763) but extremely low sensitivity (20%), revealing strong bias toward benign cases. Techniques to address imbalance—SMOTEENN, Focal Loss, and stacking—proved unstable and sometimes performed no better than chance. To overcome these issues, a new hybrid non-linear architecture, the “Expert Committee,” was developed. It combines a high-sensitivity Generalist (ensemble of XGBoost, LightGBM, Logistic Regression) with a high-specificity Specialist (RF-RFECV). Their outputs are merged through a calibrated, agreement-based ensemble rule. Using 5-fold Nested Cross-Validation, the final model achieved balanced performance: AUC 0.787, Sensitivity 0.700, Specificity 0.887. The work’s main contribution is methodological, demonstrating how tailored architectures can address instability in data-scarce radiomics. | en_UK |
| dc.language.iso | en | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.title | Previsione dell'Istologia delle Lesioni Mammarie a partire da Caratteristiche Radiomiche Utilizzando l'Apprendimento Automatico: Uno Studio di Caso Metodologico. | it_IT |
| dc.title.alternative | Predicting Breast Lesion Histology from Radiomic Features Using Machine Learning: A Methodological Case Study. | en_UK |
| dc.type | info:eu-repo/semantics/masterThesis | |
| dc.subject.miur | MAT/08 - ANALISI NUMERICA | |
| dc.publisher.name | Università degli studi di Genova | |
| dc.date.academicyear | 2024/2025 | |
| dc.description.corsolaurea | 11267 - ECONOMICS AND DATA SCIENCE | |
| dc.description.area | 28 - ECONOMIA | |
| dc.description.department | 100012 - DIPARTIMENTO DI ECONOMIA |
Files in questo item
Questo item appare nelle seguenti collezioni
-
Laurea Magistrale [6806]


