Rilevamento automatico delle anomalie nella distribuzione dei prodotti petroliferi mediante tecniche di apprendimento automatico
View/ Open
Author
Caushi, Paola <2001>
Date
2024-10-15Data available
2024-10-17Abstract
Il rilevamento delle anomalie è il processo di individuazione di modelli o punti che si discostano dalle norme previste. Esistono diverse ragioni per il loro verificarsi, tra cui guasti del sistema, eventi rari, attività fraudolente intenzionali e fattori esterni che generano i modelli. Esistono diversi modi per eseguire il rilevamento delle anomalie, come: metodi tradizionali o metodi statistici, approcci basati sull'apprendimento automatico (sia apprendimento supervisionato che non supervisionato), tecniche di apprendimento approfondito e sistemi di rilevamento delle anomalie in tempo reale. L'intento alla base di questa tesi è di indagare se e in quale misura alcuni dei metodi di apprendimento automatico più promettenti, come Support Vector Machines, Autoencoders, Random Forest, k-Means, Logistic Regression e metodi ensemble, hanno il potenziale per affrontare il problema dell'identificazione delle anomalie in un'applicazione Smart Transportation System utilizzata per la distribuzione di prodotti petroliferi. Queste informazioni in tempo reale sono importanti per identificare automaticamente potenziali anomalie, in particolare quelle che si sono verificate lontano da depositi e stazioni di servizio. La sfida più grande nel rilevamento delle anomalie è spesso la mancanza di dati di addestramento sufficienti per i modelli creati e la corretta etichettatura dei dati. L'ultima sezione riguarderebbe il transfer learning, un mix di tecniche di machine learning in cui la conoscenza acquisita da un'attività diversa ma correlata viene applicata per affrontare la scarsità di dati sulla distribuzione dei prodotti petroliferi per l'addestramento di modelli di rilevamento delle anomalie.
Parole chiave: Distribuzione dei prodotti petroliferi, Rilevamento delle anomalie, Machine learning, Support Vector Machines (SVM), Metodi ensemble, Random Forest, Autoencoder, Transfer learning. Anomaly detection is the process of finding patterns or points that
deviate from expected norms. There are different reasons for their
occurrence, including system failures, rare events, intentional fraudu
lent activity, and external factors that generate the patterns. There
are different ways to perform anomaly detection, such as: traditional
methods or statistical methods, machine learning- based approaches
(both supervised and unsupervised learning), deep learning techniques
and real-time anomaly detection systems. The intent behind this the
sis is to investigate whether and to what degree some of the most
promising machine learning methods, such as Support Vector Ma
chines, Autoencoders, Random Forest, k-Means, Logistic Regression,
and ensemble methods, have the potential to deal with the problem of
identifying anomalies in a Smart Transportation System application
used for the distribution of petrol products. This real-time informa
tion is important to automatically identify potential anomalies, espe
cially those that occurred far from depots and service stations. The
biggest challenge in anomaly detection is often the lack of sufficient
training data for the created models and the correct labeling of the
data. The last section would be about transfer learning, a mix of ma
chine learning techniques in which knowledge gained from a different
but related task is applied to address the scarcity of petrol product
distribution data for training anomaly detection models.
Keywords: Petrol product distribution, Anomaly detection, Ma
chine learning, Support Vector Machines (SVM), Ensemble methods,
Random Forest, Autoencoders, Transfer learning.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [5646]