Università di Genova logo, link al sitoUniRe logo, link alla pagina iniziale
    • English
    • italiano
  • English 
    • English
    • italiano
  • Login
View Item 
  •   DSpace Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • View Item
  •   DSpace Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Previsione dell'Istologia delle Lesioni Mammarie a partire da Caratteristiche Radiomiche Utilizzando l'Apprendimento Automatico: Uno Studio di Caso Metodologico.

Thumbnail
View/Open
tesi35995902.pdf (3.745Mb)
Author
Rotolo, Giancarlo <2001>
Date
2025-12-16
Data available
2025-12-18
Abstract
La tesi affronta la predizione dell’istologia delle lesioni mammarie tramite feature radiomiche in un dataset molto ridotto e sbilanciato (73 pazienti, 492 feature, 27,4% maligni). Gli approcci ML convenzionali mostrano limiti evidenti: la selezione delle feature non ha trovato predittori stabili e una Random Forest ottimizzata per AUC ha ottenuto una discriminazione discreta (AUC 0.763) ma sensibilità molto bassa (20%), indicando un forte bias verso i casi benigni. Tecniche per gestire lo sbilanciamento, come SMOTEENN, Focal Loss e stacking, hanno fornito risultati instabili. Per superare queste difficoltà è stata proposta l’architettura ibrida “Expert Committee.” Essa combina un Generalist ad alta sensibilità (ensemble di XGBoost, LightGBM e Regressione Logistica) con uno Specialist ad alta specificità (RF-RFECV), integrando le predizioni tramite un ensemble calibrato basato sull’accordo. La Nested Cross-Validation a 5 fold ha prodotto un profilo bilanciato: AUC 0.787, Sensibilità 0.700, Specificità 0.887. Il contributo principale è metodologico, offrendo una strategia più stabile per la radiomica a basso numero di campioni.
 
This thesis tackles the challenge of predicting breast lesion histology from radiomic features in a highly limited and imbalanced dataset (73 patients, 492 features, 27.4% malignant). Standard ML methods showed clear limits: robustness-based feature selection found no stable predictors, and a Random Forest optimized for AUC reached acceptable discrimination (AUC 0.763) but extremely low sensitivity (20%), revealing strong bias toward benign cases. Techniques to address imbalance—SMOTEENN, Focal Loss, and stacking—proved unstable and sometimes performed no better than chance. To overcome these issues, a new hybrid non-linear architecture, the “Expert Committee,” was developed. It combines a high-sensitivity Generalist (ensemble of XGBoost, LightGBM, Logistic Regression) with a high-specificity Specialist (RF-RFECV). Their outputs are merged through a calibrated, agreement-based ensemble rule. Using 5-fold Nested Cross-Validation, the final model achieved balanced performance: AUC 0.787, Sensitivity 0.700, Specificity 0.887. The work’s main contribution is methodological, demonstrating how tailored architectures can address instability in data-scarce radiomics.
 
Type
info:eu-repo/semantics/masterThesis
Collections
  • Laurea Magistrale [6806]
URI
https://unire.unige.it/handle/123456789/14301
Metadata
Show full item record

UniRe - Università degli studi di Genova | Information and Contacts
 

 

All of DSpaceCommunities & Collections

My Account

Login

UniRe - Università degli studi di Genova | Information and Contacts