| dc.contributor.advisor | Oneto, Luca <1986> | |
| dc.contributor.advisor | Ribaudo, Marina <1964> | |
| dc.contributor.author | Vicentini, Alberto <1992> | |
| dc.contributor.other | Frederic Mielcarek | |
| dc.date.accessioned | 2026-04-02T14:24:30Z | |
| dc.date.available | 2026-04-02T14:24:30Z | |
| dc.date.issued | 2026-03-26 | |
| dc.identifier.uri | https://unire.unige.it/handle/123456789/15539 | |
| dc.description.abstract | Il presente lavoro indaga il rilevamento delle emissioni gassose basato su immagini per il monitoraggio delle cokerie, un problema complesso di visione artificiale dovuto alla natura amorfa, semitrasparente e a basso contrasto del target. Lo studio affronta non solo l'accuratezza del rilevamento, ma anche i vincoli di implementazione tipici del monitoraggio industriale multi-camera.
È stato definito un framework comparativo all'interno di MMDetection per valutare famiglie rappresentative di rilevatori secondo un protocollo comune, includendo modelli one-stage (RTMDet, YOLOX), un modello two-stage (Faster R-CNN) e un modello basato su transformer (DINO). L’analisi prende in esame diverse risoluzioni di input e combina le metriche standard in formato COCO con indicatori a livello di evento derivati da grandezze orientate al recall; in tal modo, la selezione del rilevatore viene configurata come un problema multi-obiettivo. Nello specifico, il recall a livello di frame viene utilizzato per stimare il numero minimo di osservazioni necessarie a raggiungere una confidenza target nel rilevamento dell'evento, mentre il costo computazionale è valutato attraverso misurazioni di latenza e throughput.
I risultati evidenziano marcate differenze tra le famiglie di rilevatori in termini di sensibilità alla risoluzione, robustezza verso i piccoli oggetti e affidabilità a livello di evento. RTMDet beneficia significativamente dell'aumento della risoluzione, Faster R-CNN ottiene la massima accuratezza ad alta risoluzione, YOLOX rappresenta la baseline più orientata alla riduzione della latenza e DINO fornisce il bilanciamento più favorevole tra affidabilità e costo computazionale. Inoltre, è stata sviluppata una dashboard in Grafana orientata all'operatore per tradurre gli output analitici in un'interfaccia di monitoraggio accessibile. Per vincoli di riservatezza e accordi di non divulgazione, il dataset grezzo e le informazioni identificative del sito non possono essere diffusi. | it_IT |
| dc.description.abstract | The present work investigates image-based gas emission detection for coke-plant monitoring, a challenging computer-vision problem due to the amorphous, semi-transparent and low-contrast nature of the target. The study addresses not only detection accuracy, but also the deployment constraints of continuous multi-camera industrial monitoring.
A comparative framework was defined within MMDetection to evaluate representative detector families under a common protocol, including one-stage models (RTMDet, YOLOX), a two-stage model (Faster R-CNN) and a transformer-based model (DINO). The analysis considers different input resolutions and combines standard COCO-style metrics with event-level indicators derived from recall-oriented quantities, thus framing detector selection as a multi-objective problem. In particular, frame-level recall is used to estimate the minimum number of observations required to achieve a target event-detection confidence, while computational cost is assessed through latency and throughput measurements.
The results show marked differences across detector families in terms of resolution sensitivity, small-object robustness and event-level reliability. RTMDet benefits strongly from increasing resolution, Faster R-CNN achieves the strongest high-resolution accuracy, YOLOX represents the most latency-oriented baseline and DINO provides the most favorable balance between reliability and computational cost. In addition, an operator-oriented dashboard was developed in Grafana to translate the analytical outputs into an accessible monitoring interface. Due to confidentiality constraints and non-disclosure agreements, the raw dataset and site-identifying information cannot be disclosed. | en_UK |
| dc.language.iso | en | |
| dc.rights | info:eu-repo/semantics/restrictedAccess | |
| dc.title | Monitoraggio visivo delle emissioni di gas industriali tramite deep learning | it_IT |
| dc.title.alternative | Visual monitoring of industrial gas emissions using deep learning | en_UK |
| dc.type | info:eu-repo/semantics/masterThesis | |
| dc.subject.miur | ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI | |
| dc.publisher.name | Università degli studi di Genova | |
| dc.date.academicyear | 2024/2025 | |
| dc.description.corsolaurea | 10852 - COMPUTER SCIENCE | |
| dc.description.area | 7 - SCIENZE MAT.FIS.NAT. | |
| dc.description.department | 100023 - DIPARTIMENTO DI INFORMATICA, BIOINGEGNERIA, ROBOTICA E INGEGNERIA DEI SISTEMI | |