Reti Neurali per la Diagnosi Differenziale tra Candidemia e Batteriemia
View/ Open
Author
Razzetta, Anna <2000>
Date
2024-07-24Data available
2024-08-01Abstract
La ricerca nel campo dell'infettivologia è fondamentale per comprendere e controllare le malattie infettive causate da virus, batteri e parassiti. In particolare, le infezioni del flusso sanguigno come la candidemia e la batteriemia rappresentano una grave minaccia per i pazienti ospedalizzati. Questa tesi si propone di migliorare la distinzione tra candidemia e batteriemia utilizzando reti neurali, basandosi sul progetto AUTO-CAND, che ha esaminato vari algoritmi di machine learning. L'obiettivo principale è valutare l'efficacia delle reti neurali rispetto al random forest, migliorando la precisione diagnostica e contribuendo a decisioni cliniche tempestive. Il dataset utilizzato comprende 15752 episodi di infezioni del flusso sanguigno raccolti tra il 2011 e il 2019, includendo dati demografici e microbiologici. La selezione delle features è un elemento cruciale per migliorare le performance del modello. Sono stati esplorati tre metodi di feature selection, con particolare attenzione al Correlation-Based Permutation Feature Importance (CBPFI), che tiene conto delle correlazioni tra variabili. I risultati ottenuti dimostrano che l'inclusione delle variabili selezionate con il metodo CBPFI ha migliorato significativamente le performance del modello di rete neurale. Il True Skill Statistic (TSS) del modello con le features selezionate è risultato più alto (0,419) rispetto a quello con solo BDG e PCT (0,343). Inoltre, la recall e la specificity sono migliorate rispettivamente a 0,814 e 0,605 nel modello con più variabili, rispetto a 0,774 e 0,569 nel modello ridotto. In conclusione, l'utilizzo di un algoritmo di feature selection che considera le correlazioni tra le variabili ha rappresentato un significativo avanzamento rispetto ai metodi tradizionali. Questo approccio ha permesso di ottenere un modello predittivo più robusto e preciso, migliorando così la gestione delle infezioni del flusso sanguigno nei pazienti ospedalizzati. Research in the field of infectious diseases is crucial for understanding and controlling infections caused by pathogens such as viruses, bacteria, and parasites. Specifically, bloodstream infections like candidemia and bacteremia pose a serious threat to hospitalized patients. This thesis aims to improve the distinction between candidemia and bacteremia using neural networks, building upon the AUTO-CAND project, which examined various machine learning algorithms. The main objective is to evaluate the effectiveness of neural networks compared to random forest, enhancing diagnostic accuracy and contributing to timely clinical decisions. The dataset used includes 15,752 episodes of bloodstream infections collected between 2011 and 2019, encompassing demographic and microbiological data. Feature selection is a critical component for improving model performance. Three feature selection methods were explored, with particular focus on Correlation-Based Permutation Feature Importance (CBPFI), which accounts for correlations between variables.The results demonstrate that including variables selected with the CBPFI method significantly improved the performance of the neural network model. The True Skill Statistic (TSS) of the model with selected features was higher (0.419) compared to the model with only BDG and PCT (0.343). Furthermore, recall and specificity improved to 0.814 and 0.605, respectively, in the model with more variables, compared to 0.774 and 0.569 in the reduced model. In conclusion, the use of a feature selection algorithm that considers correlations between variables represented a significant advancement over traditional methods. This approach enabled the development of a more robust and accurate predictive model, thereby improving the management of bloodstream infections in hospitalized patients.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [4322]