| dc.contributor.advisor | Guerrini, Giovanna <1969> | |
| dc.contributor.advisor | Catania, Barbara <1969> | |
| dc.contributor.advisor | Pastore, Vito Paolo <1989> | |
| dc.contributor.author | Morando, Andrea <1999> | |
| dc.date.accessioned | 2025-10-30T15:13:13Z | |
| dc.date.available | 2025-10-30T15:13:13Z | |
| dc.date.issued | 2025-10-24 | |
| dc.identifier.uri | https://unire.unige.it/handle/123456789/13538 | |
| dc.description.abstract | Questa tesi esplora l'integrazione del machine learning nei sistemi di gestione di database, con particolare attenzione a PostgresML, un'estensione di PostgreSQL che consente agli utenti di addestrare modelli, generare embedding ed eseguire il clustering direttamente in SQL. L'idea alla base di questo paradigma è quella di ridurre la distanza tra dati e algoritmi, evitando la necessità di pipeline esterne che comportano costi, complessità, rischi per la sicurezza e la privacy.
Il lavoro si concentra su tre casi di studio concreti: la mappatura semantica delle professioni dichiarate nei registri anagrafici, ricondotte automaticamente alle professioni ISTAT, il clustering delle unità urbane di Genova in base alla distribuzione dei servizi e alla densità di popolazione, e un sistema RAG sperimentale basato su documenti sintetici. Tutte le analisi sono state implementate interamente in database, con il supporto di funzioni PostgresML, e alcune di esse sono state confrontate con una baseline creata in Python. | it_IT |
| dc.description.abstract | This thesis explores the integration of machine learning within database management systems, with a particular focus on PostgresML, an extension of PostgreSQL allowing users to train models, generate embeddings, and perform clustering directly in SQL. The idea behind this paradigm is to reduce the distance between data and algorithms, avoiding the need for external pipelines that involve costs, complexity, security and privacy risks.
The work focuses on three concrete case studies: the semantic mapping of professions declared in registry records, automatically traced back to ISTAT professions, the clustering of urban units in Genoa based on the distribution of services and population density, and a sperimental RAG system based on synthetic documents. All analyses were implemented entirely in-database, with the support of PostgresML functions, and some of them were compared with a baseline created in Python. | en_UK |
| dc.language.iso | en | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.title | Integrare l'apprendimento automatico nei sistemi di gestione dei database: efficacia, efficienza e casi di studio | it_IT |
| dc.title.alternative | Moving Machine Learning into Database Management Systems: Effectiveness, Efficiency, and Case Studies | en_UK |
| dc.type | info:eu-repo/semantics/masterThesis | |
| dc.subject.miur | INF/01 - INFORMATICA | |
| dc.publisher.name | Università degli studi di Genova | |
| dc.date.academicyear | 2024/2025 | |
| dc.description.corsolaurea | 10852 - COMPUTER SCIENCE | |
| dc.description.area | 7 - SCIENZE MAT.FIS.NAT. | |
| dc.description.department | 100023 - DIPARTIMENTO DI INFORMATICA, BIOINGEGNERIA, ROBOTICA E INGEGNERIA DEI SISTEMI | |