Elaborazione di dati geospaziali responsabile

View/ Open
Author
Maatouk, Hussein <2001>
Date
2025-03-26Data available
2025-04-03Abstract
La crescente dipendenza dalle decisioni basate sui dati ha favorito lo sviluppo dell’intelligenza artificiale, della business intelligence e dell’analisi dei dati. Tuttavia, queste tecnologie rimangono soggette a bias, specialmente nei dati geospaziali. Mentre il bias nei dati non spaziali è stato ampiamente studiato, l’equità nei contesti geospaziali è ancora poco esplorata. Questa tesi analizza il bias di rappresentazione nei processi di elaborazione dei dati geospaziali e propone un nuovo approccio di riscrittura delle query per mitigarne gli effetti.
La ricerca introduce il concetto di copertura in un contesto spaziale e presenta Spatial-covRew, un’estensione del framework covRew, progettata per garantire una rappresentazione equa degli attributi spazialmente sensibili nelle query non spaziali. Successivamente, viene proposto un secondo algoritmo per la riscrittura delle query spaziali, migliorando l’equità nell’analisi geospaziale.
Il lavoro utilizza dati reali sui crimini di New York City per studiare come le query spaziali interagiscono con i distretti urbani. I risultati dimostrano che le query spaziali standard generano rappresentazioni squilibrate, influenzando le analisi e la distribuzione delle risorse.
Questa ricerca colma una lacuna critica nell’equità geospaziale, migliorando l’analisi dei dati spaziali e contribuendo allo sviluppo di metodi più equi e consapevoli del bias. The growing reliance on data-driven decision-making has advanced artificial intelligence,
business intelligence, and data analytics. However, these technologies remain subject to
bias, especially in geospatial data. While bias in non-spatial data is well-studied, fairness
in geospatial contexts is underexplored. This thesis investigates representation bias in
geospatial data processing and proposes a novel query rewriting approach to mitigate it.
This research defines coverage in a spatial context, and then introduces Spatial-covRew,
an extension of the covRew query rewriting framework , tailored for spatially sensitive
attributes and non-spatial queries. By enforcing coverage constraints, this method ensures
fair representation across geographic regions. Then we propose a second algorithm that
rewrites spatial queries involving spatially sensitive attributes, enhancing fairness in
geospatial analysis. The study examines real-world crime data from New York City,
analyzing how spatial queries interact with boroughs. Results show that naive spatial
queries often lead to imbalanced representations, affecting analysis and law enforcement
resource allocation.
By adapting query rewriting from non-spatial domains, this work addresses a critical gap
in geospatial fairness. The proposed solution improves spatial data analysis by reducing
underrepresentation while preserving query intent. The findings contribute to algorithmic
fairness and provide a foundation for future bias-aware geospatial processing.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [5638]