Rilevamento di attacchi Cross-Site Scripting basato sul Machine Learning

Gnisci, Roberto <1998>

Mostra/Apri

tesi25983484.pdf (1.894Mb)

Autore

Gnisci, Roberto <1998>

Data

2023-10-26

Disponibile dal

2023-11-02

Abstract

Il problema affrontato da questa tesi è il rilevamento e la mitigazione degli attacchi Cross-Site Scripting (XSS) nelle applicazioni web. L’approccio proposto sfrutta tecniche di apprendimento non supervisionato, impiegando un modello SVM (One-Class Support Vector Machine) per identificare pattern all’interno di dati senza etichetta. Questo approccio si fonda su una serie completa di passaggi, tra cui efficienti tecniche di pre-elaborazione, estrazione di features critiche e selezione del modello. Un'innovazione fondamentale risiede nell'introduzione di modelli One-Class SVM duali, specializzati nel rilevamento di codici XSS in contenuto HTML e JavaScript. La possibilità di scegliere tra questi modelli aggiunge un livello di adattabilità, consentendo meccanismi di difesa su misura, basati sullo scenario della minaccia. Per affrontare l’ambiguità nelle previsioni del modello, proponiamo due strategie di valutazione, fornendo flessibilità nelle risposte di sicurezza. Una pipeline avanzata di pre-elaborazione, che comprende tecniche avanzate di generalizzazione e perfezionamento dei dati, aumenta significativamente la qualità dei dati, migliorando l’efficacia del classificatore. I risultati di questa ricerca arricchiscono le possibili soluzioni utili per contrastare gli attacchi XSS, potenziando le tradizionali soluzioni software basate su regole con la potenza delle tecniche di machine learning.

The problem addressed by this thesis is the detection and mitigation of Cross-Site Scripting (XSS) attacks in web applications. The proposed approach leverages unsupervised learning techniques, employing a One-Class Support Vector Ma- chine (SVM) model to decipher patterns within unlabeled data. This approach is founded on a comprehensive set of steps, including efficient pre-processing tech- niques, critical feature extraction, and model selection. A pivotal innovation lies in the introduction of dual One-Class SVM models, spe- cializing in the detection of XSS-related HTML and JavaScript content. The ability to select between these models adds a layer of adaptability, enabling tailored defense mechanisms based on threat scenarios. To address ambiguity in model predictions, we propose two evaluation strategies, providing flexibility in security responses. An advanced pre-processing pipeline, encompassing enhanced generalization and data refinement techniques, signifi- cantly elevates data quality, enhancing the classifier’s efficacy. The outcomes of this research enrich the possible solutions useful for combating XSS attacks, enhancing traditional rule-based software solutions with the power of machine learning techniques.

Tipo

info:eu-repo/semantics/masterThesis