Monitoraggio visivo delle emissioni di gas industriali tramite deep learning

Vicentini, Alberto <1992>

Mostra/Apri

tesi37256917.pdf (19.56Mb)

Autore

Vicentini, Alberto <1992>

Data

2026-03-26

Disponibile dal

2026-04-02

Abstract

Il presente lavoro indaga il rilevamento delle emissioni gassose basato su immagini per il monitoraggio delle cokerie, un problema complesso di visione artificiale dovuto alla natura amorfa, semitrasparente e a basso contrasto del target. Lo studio affronta non solo l'accuratezza del rilevamento, ma anche i vincoli di implementazione tipici del monitoraggio industriale multi-camera. È stato definito un framework comparativo all'interno di MMDetection per valutare famiglie rappresentative di rilevatori secondo un protocollo comune, includendo modelli one-stage (RTMDet, YOLOX), un modello two-stage (Faster R-CNN) e un modello basato su transformer (DINO). L’analisi prende in esame diverse risoluzioni di input e combina le metriche standard in formato COCO con indicatori a livello di evento derivati da grandezze orientate al recall; in tal modo, la selezione del rilevatore viene configurata come un problema multi-obiettivo. Nello specifico, il recall a livello di frame viene utilizzato per stimare il numero minimo di osservazioni necessarie a raggiungere una confidenza target nel rilevamento dell'evento, mentre il costo computazionale è valutato attraverso misurazioni di latenza e throughput. I risultati evidenziano marcate differenze tra le famiglie di rilevatori in termini di sensibilità alla risoluzione, robustezza verso i piccoli oggetti e affidabilità a livello di evento. RTMDet beneficia significativamente dell'aumento della risoluzione, Faster R-CNN ottiene la massima accuratezza ad alta risoluzione, YOLOX rappresenta la baseline più orientata alla riduzione della latenza e DINO fornisce il bilanciamento più favorevole tra affidabilità e costo computazionale. Inoltre, è stata sviluppata una dashboard in Grafana orientata all'operatore per tradurre gli output analitici in un'interfaccia di monitoraggio accessibile. Per vincoli di riservatezza e accordi di non divulgazione, il dataset grezzo e le informazioni identificative del sito non possono essere diffusi.

The present work investigates image-based gas emission detection for coke-plant monitoring, a challenging computer-vision problem due to the amorphous, semi-transparent and low-contrast nature of the target. The study addresses not only detection accuracy, but also the deployment constraints of continuous multi-camera industrial monitoring. A comparative framework was defined within MMDetection to evaluate representative detector families under a common protocol, including one-stage models (RTMDet, YOLOX), a two-stage model (Faster R-CNN) and a transformer-based model (DINO). The analysis considers different input resolutions and combines standard COCO-style metrics with event-level indicators derived from recall-oriented quantities, thus framing detector selection as a multi-objective problem. In particular, frame-level recall is used to estimate the minimum number of observations required to achieve a target event-detection confidence, while computational cost is assessed through latency and throughput measurements. The results show marked differences across detector families in terms of resolution sensitivity, small-object robustness and event-level reliability. RTMDet benefits strongly from increasing resolution, Faster R-CNN achieves the strongest high-resolution accuracy, YOLOX represents the most latency-oriented baseline and DINO provides the most favorable balance between reliability and computational cost. In addition, an operator-oriented dashboard was developed in Grafana to translate the analytical outputs into an accessible monitoring interface. Due to confidentiality constraints and non-disclosure agreements, the raw dataset and site-identifying information cannot be disclosed.

Tipo

info:eu-repo/semantics/masterThesis