L'applicazione dell’intelligenza artificiale nel campo dell’endoscopia laringea. Il ruolo della segmentazione automatica in tempo reale del carcinoma laringeo.
View/ Open
Author
Ioppi, Alessandro <1993>
Date
2023-11-07Data available
2023-11-16Abstract
Obbiettivo
Studiare il potenziale del deep learning per delineare (segmentare) automaticamente l’estensione superficiale del cancro laringeo su immagini e video endoscopici.
Metodi
È stato condotto uno studio retrospettivo estraendo e annotando fotogrammi di luce bianca (WL) e Narrow Band Imaging (NBI) per addestrare un modello di segmentazione (SegMENT-Plus). Per la validazione sono stati utilizzati due set di dati esterni. Le prestazioni del modello sono state confrontate con quelle di due specializzandi in otorinolaringoiatria. Inoltre, il modello è stato testato su video reali di laringoscopia intraoperatoria.
Risultati
Sono state utilizzate un totale di 3933 immagini di cancro laringeo di 557 pazienti. Il modello ha raggiunto i seguenti valori mediani (intervallo interquartile): Coefficiente di somiglianza (DSC)=0,83 (0,70-0,90), Intersezione sull'unione (IoU)=0,83 (0,73-0,90), Accuratezza=0,97 (0,95-0,99), Inferenza = 25,6 (25,1-26,1) FPS. I gruppi di test esterni comprendevano 156 e 200 immagini. SegMENT-Plus ha ottenuto risultati simili su tutti e tre i set di dati per DSC (p=0,05) e IoU (p=0,07). Non sono state notate differenze significative analizzando separatamente le immagini dei test WL e NBI su DSC (p=0,06) e IoU (p=0,78) e analizzando il modello rispetto ai due specializzandi su DSC (p=0,06) e IoU (Senior vs. SegMENT-Plus, p=0,13; Junior vs. SegMENT-Plus, p=1,00).
Conclusione
SegMENT-Plus può delineare con precisione i confini del cancro laringeo nelle immagini endoscopiche, con prestazioni pari a quelle di due specializzandi in otorinolaringoiatria. I risultati sui due set di dati esterni dimostrano eccellenti capacità di generalizzazione. La velocità di calcolo del modello ne ha consentito l'applicazione su videolaringoscopie simulando l'utilizzo in tempo reale. Sono necessari studi clinici per valutare il ruolo di questa tecnologia nella pratica chirurgica Objective
To investigate the potential of deep learning for automatically delineating (segmenting) laryngeal cancer superficial extent on endoscopic images and videos.
Methods
A retrospective study was conducted extracting and annotating white light (WL) and Narrow Band Imaging (NBI) frames to train a segmentation model (SegMENT-Plus). Two external datasets were used for validation. The model’s performances were compared with those of two otolaryngology residents. In addition, the model was tested on real intraoperative laryngoscopy videos.
Results
A total of 3933 images of laryngeal cancer from 557 patients were used. The model achieved the following median values (interquartile range): Dice Similarity Coefficient (DSC)=0.83 (0.70-0.90), Intersection over Union (IoU)=0.83 (0.73-0.90), Accuracy=0.97 (0.95-0.99), Inference Speed = 25.6 (25.1-26.1) FPS. The external testing cohorts comprised 156 and 200 images. SegMENT-Plus performed similarly on all three datasets for DSC (p=0.05) and IoU (p=0.07). No significant differences were noticed when separately analyzing WL and NBI test images on DSC (p=0.06) and IoU (p=0.78) and when analyzing the model vs. the two residents on DSC (p=0.06) and IoU (Senior vs. SegMENT-Plus, p=0.13; Junior vs. SegMENT-Plus, p=1.00). The model was then tested on real intraoperative laryngoscopy videos.
Conclusion
SegMENT-Plus can accurately delineate laryngeal cancer boundaries in endoscopic images, with performances equal to those of two otolaryngology residents. The results on the two external datasets demonstrate excellent generalization capabilities. The computation speed of the model allowed its application on videolaryngoscopies simulating real-time use. Clinical trials are needed to evaluate the role of this technology in surgical practice.