Università di Genova logo, link al sitoUniRe logo, link alla pagina iniziale
    • English
    • italiano
  • italiano 
    • English
    • italiano
  • Login
Mostra Item 
  •   Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • Mostra Item
  •   Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • Mostra Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Integrare l'apprendimento automatico nei sistemi di gestione dei database: efficacia, efficienza e casi di studio

Thumbnail
Mostra/Apri
tesi35117836.pdf (3.254Mb)
Autore
Morando, Andrea <1999>
Data
2025-10-24
Disponibile dal
2025-10-30
Abstract
Questa tesi esplora l'integrazione del machine learning nei sistemi di gestione di database, con particolare attenzione a PostgresML, un'estensione di PostgreSQL che consente agli utenti di addestrare modelli, generare embedding ed eseguire il clustering direttamente in SQL. L'idea alla base di questo paradigma è quella di ridurre la distanza tra dati e algoritmi, evitando la necessità di pipeline esterne che comportano costi, complessità, rischi per la sicurezza e la privacy. Il lavoro si concentra su tre casi di studio concreti: la mappatura semantica delle professioni dichiarate nei registri anagrafici, ricondotte automaticamente alle professioni ISTAT, il clustering delle unità urbane di Genova in base alla distribuzione dei servizi e alla densità di popolazione, e un sistema RAG sperimentale basato su documenti sintetici. Tutte le analisi sono state implementate interamente in database, con il supporto di funzioni PostgresML, e alcune di esse sono state confrontate con una baseline creata in Python.
 
This thesis explores the integration of machine learning within database management systems, with a particular focus on PostgresML, an extension of PostgreSQL allowing users to train models, generate embeddings, and perform clustering directly in SQL. The idea behind this paradigm is to reduce the distance between data and algorithms, avoiding the need for external pipelines that involve costs, complexity, security and privacy risks. The work focuses on three concrete case studies: the semantic mapping of professions declared in registry records, automatically traced back to ISTAT professions, the clustering of urban units in Genoa based on the distribution of services and population density, and a sperimental RAG system based on synthetic documents. All analyses were implemented entirely in-database, with the support of PostgresML functions, and some of them were compared with a baseline created in Python.
 
Tipo
info:eu-repo/semantics/masterThesis
Collezioni
  • Laurea Magistrale [6674]
URI
https://unire.unige.it/handle/123456789/13538
Metadati
Mostra tutti i dati dell'item

UniRe - Università degli studi di Genova | Informazioni e Supporto
 

 

UniReArchivi & Collezioni

Area personale

Login

UniRe - Università degli studi di Genova | Informazioni e Supporto