Mitigazione del Bias di Rappresentazione nell'Apprendimento Federato
View/ Open
Author
Brocchi, Martina <2000>
Date
2024-12-17Data available
2024-12-19Abstract
L'ampio utilizzo di dati legati agli esseri umani nei processi decisionali automatizzati può amplificare la discriminazione presente nel mondo reale, sottolineando la necessità di soluzioni tecnologiche più eque. Allo stesso tempo, le crescenti preoccupazioni legate alla privacy richiedono strategie che garantiscano sia la sicurezza dei dati che risultati equi. Il Federated Learning (FL), un paradigma di apprendimento automatico che consente l'addestramento di modelli distribuiti senza accesso diretto ai dati, si è affermato come un approccio promettente per affrontare queste sfide.
Questa tesi magistrale analizza l'integrazione del vincolo di non discriminazione della coverage nei contesti di Federated Learning. La coverage garantisce che i dataset abbiano una rappresentazione sufficiente delle categorie di interesse, promuovendo diversità ed equità. A differenza delle precedenti applicazioni della coverage nella preparazione dei dati, questo lavoro esplora il suo impatto a livello algoritmico, proponendo un algoritmo Federated Learning basato sulla coverage e una tecnica di selezione dei client che privilegino la rappresentazione equa.
Per valutare il nostro approccio, progettiamo tre configurazioni basate sulla coverage per generare distribuzioni di dati diversificate. I risultati sperimentali dimostrano l'efficacia dei metodi proposti nel raggiungere l'equità e nel mantenere le prestazioni. Per quanto ne sappiamo, nessun lavoro precedente ha affrontato soluzioni basate sulla copertura nel contesto del Federated Learning, evidenziando la novità e le potenziali contribuzioni di questa ricerca. The extensive use of human-related data in automated decision-making processes can exacerbate real-world discrimination, emphasizing the need for fair technological solutions. Simultaneously, growing privacy concerns necessitate strategies that ensure both data security and equitable outcomes. Federated Learning (FL), a machine-learning paradigm that enables distributed model training without direct data access, has emerged as a promising approach for addressing these challenges.
This Master's thesis investigates the integration of the coverage nondiscrimination constraint, into Federated Learning settings. Coverage ensures datasets have sufficient representation across categories of interest, promoting diversity and equity. Unlike prior applications of coverage in data preparation, this work explores its impact at the algorithmic level by proposing a coverage-based Federated Learning algorithm and a client selection technique that prioritize equitable representation.
To evaluate our approach, we design three coverage-based setups to generate diverse data distributions. Experimental results demonstrate the effectiveness of our proposed methods in achieving fairness and maintaining performance. As far as we know, no previous work has addressed coverage-based solutions in Federated Learning, highlighting the novelty and potential contributions of this research.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [4954]