Integrare l'apprendimento automatico e i sistemi basati su regole per il rilevamento delle frodi.

View/ Open
Author
Mantero, Giorgio <1998>
Date
2025-03-26Data available
2025-04-03Abstract
Il riciclaggio di denaro è una delle sfide globali più rilevanti, con ricadute significative sull'economia e sulla sicurezza internazionale. Individuare transazioni sospette è un elemento chiave nella lotta al fenomeno, ma il compito è estremamente complesso a causa della continua evoluzione delle strategie adottate dai criminali e della grande quantità di dati da analizzare quotidianamente.
Questa tesi propone un metodo ibrido che integra modelli di machine learning con regole euristiche, con l'obiettivo di identificare più efficacemente le transazioni fraudolente. Il dataset utilizzato, SAML-D, include milioni di transazioni bancarie e presenta un forte squilibrio tra classi (transazioni fraudolente vs regolari). L'intero processo è stato svolto tramite Rulex Platform, una piattaforma di self-code progettata per ottimizzare la gestione, l'elaborazione e l'analisi dei dati.
Le regole euristiche sono state valutate utilizzando le metriche di copertura e di errore, e poi integrate nel task Logic Learning Machine (LLM). L'efficacia dell'approccio è stata verificata confrontando due configurazioni principali: una basata esclusivamente sull'uso di LLM e l'altra che combina LLM e regole euristiche.
I risultati ottenuti evidenziano come l'integrazione di regole euristiche migliori le prestazioni del modello, evidenziando la sinergia tra apprendimento automatico e conoscenza esperta. I potenziali sviluppi futuri del progetto includono il test su nuovi set di dati e lo sviluppo di ulteriori regole euristiche per contrastare nuove tecniche di riciclaggio di denaro. Questa tesi conferma l'efficacia dell'approccio ibrido e sottolinea l'importanza dell'unione tra analisi automatizzata e intuizione umana per affrontare le sfide poste dal riciclaggio di denaro. Money laundering is one of the most relevant global challenges, with significant repercussions on the economy and international security. Identifying suspicious transactions is a key element in the fight against the phenomenon, but the task is extremely complex due to the constant evolution of the strategies adopted by criminals and the great amount of data to be analyzed daily.
This thesis proposes a hybrid method that integrates machine learning models with heuristic rules, with the aim of identifying fraudulent transactions more effectively. The dataset used, SAML-D, includes millions of bank transactions and presents a strong imbalance between classes (fraudulent vs regular transactions). The entire process was carried out through Rulex Platform, a self-code platform designed to optimize data management, processing and analysis.
The heuristic rules were evaluated using the covering and error metrics, and then integrated into the Logic Learning Machine (LLM) task. The effectiveness of the approach was verified by comparing two main configurations: one based exclusively on the use of LLM and the other combining LLM and heuristic rules.
The results obtained highlight how the integration of heuristic rules improves the performance of the model, highlighting the synergy between machine learning and expert knowledge. Potential future developments of the project include the testing on new datasets and the development of additional heuristic rules to counter new money laundering techniques. This thesis confirms the effectiveness of the hybrid approach and emphasizes the importance of the union between automated analysis and human insight to address the challenges posed by money laundering.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [5638]