Università di Genova logo, link al sitoUniRe logo, link alla pagina iniziale
    • English
    • italiano
  • English 
    • English
    • italiano
  • Login
View Item 
  •   DSpace Home
  • Tesi
  • Tesi di Laurea
  • Laurea Triennale
  • View Item
  •   DSpace Home
  • Tesi
  • Tesi di Laurea
  • Laurea Triennale
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Analisi e predizione del fenomeno del no-show in ambito medico

View/Open
tesi36072902.pdf (763.0Kb)
Author
Queirolo, Federico Ernesto <2002>
Date
2025-12-05
Data available
2025-12-18
Abstract
Il fenomeno del "no-show", ovvero la mancata presentazione dei pazienti agli appuntamenti medici prenotati, rappresenta una delle principali criticità per i sistemi sanitari, causando inefficienze operative e l'allungamento delle liste d'attesa. Il presente lavoro di tesi si propone di affrontare tale problematica sviluppando un modello predittivo basato su tecniche di Machine Learning, con l'obiettivo di identificare preventivamente i pazienti a rischio di assenza e ottimizzare l'allocazione delle risorse. Dal punto di vista teorico, lo studio inquadra il problema nell'ambito dell'Apprendimento Supervisionato e della Classificazione Binaria, analizzando i principi della Minimizzazione del Rischio Empirico e della regolarizzazione. L'algoritmo scelto per l'implementazione è il Gradient Tree Boosting nello specifico utilizza un insieme di Alberi Decisionali. La sua applicazione è stata resa possibile dalla libreria XGBoost. L'applicazione pratica è stata condotta su un dataset reale relativo alle prestazioni sanitarie della Regione Liguria nel biennio 2023-2024. La fase di pre-processing ha richiesto una rigorosa pulizia dei dati e la gestione del marcato sbilanciamento delle classi, affrontato mediante due tecniche diverse. Sono stati realizzati due modelli distinti. Il primo, basato su feature logistiche essenziali, ha mostrato un buon tasso di identificazione ma una bassa precisione, generando numerosi falsi positivi. Il secondo modello, arricchito con variabili nuove (dati meteo, distanze temporali da festività) e ottimizzato tramite, ha permesso di raddoppiare la Precisione sul test set, raggiungendo il 63%. I risultati suggeriscono che un modello più selettivo, pur individuando meno no-show totali, garantisce un'affidabilità predittiva superiore, rendendolo uno strumento decisionale più efficace per applicare strategie di prevenzione.
 
The "no-show" phenomenon, defined as patients failing to attend scheduled medical appointments, represents a major challenge for healthcare systems, causing operational inefficiencies and lengthening waiting lists. This thesis aims to address this issue by developing a predictive model based on Machine Learning techniques, with the objective of preemptively identifying patients at risk of non-attendance and optimizing resource allocation. From a theoretical perspective, the study frames the problem within the context of Supervised Learning and Binary Classification, analyzing the principles of Empirical Risk Minimization and regularization. The algorithm selected for implementation is Gradient Tree Boosting, specifically utilizing an ensemble of Decision Trees. Its application was enabled by the XGBoost library. The practical application was conducted on a real-world dataset regarding healthcare services in the Liguria Region during the 2023-2024 period. The pre-processing phase required rigorous data cleaning and the handling of marked class imbalance, which was addressed using two different techniques. Two distinct models were developed. The first, based on essential logistical features, demonstrated a good identification rate but low precision, generating numerous false positives. The second model, enriched with new variables (weather data, proximity to holidays) and optimized, allowed for doubling the Precision on the test set, reaching 63%. The results suggest that a more selective model, while identifying fewer total no-shows, provides superior predictive reliability, making it a more effective decision-making tool for implementing prevention strategies.
 
Type
info:eu-repo/semantics/bachelorThesis
Collections
  • Laurea Triennale [4071]
URI
https://unire.unige.it/handle/123456789/14336
Metadata
Show full item record

UniRe - Università degli studi di Genova | Information and Contacts
 

 

All of DSpaceCommunities & Collections

My Account

Login

UniRe - Università degli studi di Genova | Information and Contacts