Show simple item record

dc.contributor.advisorPiana, Michele <1966>
dc.contributor.authorRotolo, Giancarlo <2001>
dc.date.accessioned2025-12-18T14:14:03Z
dc.date.available2025-12-18T14:14:03Z
dc.date.issued2025-12-16
dc.identifier.urihttps://unire.unige.it/handle/123456789/14301
dc.description.abstractLa tesi affronta la predizione dell’istologia delle lesioni mammarie tramite feature radiomiche in un dataset molto ridotto e sbilanciato (73 pazienti, 492 feature, 27,4% maligni). Gli approcci ML convenzionali mostrano limiti evidenti: la selezione delle feature non ha trovato predittori stabili e una Random Forest ottimizzata per AUC ha ottenuto una discriminazione discreta (AUC 0.763) ma sensibilità molto bassa (20%), indicando un forte bias verso i casi benigni. Tecniche per gestire lo sbilanciamento, come SMOTEENN, Focal Loss e stacking, hanno fornito risultati instabili. Per superare queste difficoltà è stata proposta l’architettura ibrida “Expert Committee.” Essa combina un Generalist ad alta sensibilità (ensemble di XGBoost, LightGBM e Regressione Logistica) con uno Specialist ad alta specificità (RF-RFECV), integrando le predizioni tramite un ensemble calibrato basato sull’accordo. La Nested Cross-Validation a 5 fold ha prodotto un profilo bilanciato: AUC 0.787, Sensibilità 0.700, Specificità 0.887. Il contributo principale è metodologico, offrendo una strategia più stabile per la radiomica a basso numero di campioni.it_IT
dc.description.abstractThis thesis tackles the challenge of predicting breast lesion histology from radiomic features in a highly limited and imbalanced dataset (73 patients, 492 features, 27.4% malignant). Standard ML methods showed clear limits: robustness-based feature selection found no stable predictors, and a Random Forest optimized for AUC reached acceptable discrimination (AUC 0.763) but extremely low sensitivity (20%), revealing strong bias toward benign cases. Techniques to address imbalance—SMOTEENN, Focal Loss, and stacking—proved unstable and sometimes performed no better than chance. To overcome these issues, a new hybrid non-linear architecture, the “Expert Committee,” was developed. It combines a high-sensitivity Generalist (ensemble of XGBoost, LightGBM, Logistic Regression) with a high-specificity Specialist (RF-RFECV). Their outputs are merged through a calibrated, agreement-based ensemble rule. Using 5-fold Nested Cross-Validation, the final model achieved balanced performance: AUC 0.787, Sensitivity 0.700, Specificity 0.887. The work’s main contribution is methodological, demonstrating how tailored architectures can address instability in data-scarce radiomics.en_UK
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.titlePrevisione dell'Istologia delle Lesioni Mammarie a partire da Caratteristiche Radiomiche Utilizzando l'Apprendimento Automatico: Uno Studio di Caso Metodologico.it_IT
dc.title.alternativePredicting Breast Lesion Histology from Radiomic Features Using Machine Learning: A Methodological Case Study.en_UK
dc.typeinfo:eu-repo/semantics/masterThesis
dc.subject.miurMAT/08 - ANALISI NUMERICA
dc.publisher.nameUniversità degli studi di Genova
dc.date.academicyear2024/2025
dc.description.corsolaurea11267 - ECONOMICS AND DATA SCIENCE
dc.description.area28 - ECONOMIA
dc.description.department100012 - DIPARTIMENTO DI ECONOMIA


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record