Mostra i principali dati dell'item
Strategia di recupero basata su grafo per sistemi RAG applicati alla documentazione tecnica ipertestuale
dc.contributor.advisor | Oneto, Luca <1986> | |
dc.contributor.author | Bolognesi, Giorgia <2000> | |
dc.contributor.other | Claudio Muselli | |
dc.date.accessioned | 2025-07-24T14:14:10Z | |
dc.date.available | 2025-07-24T14:14:10Z | |
dc.date.issued | 2025-07-18 | |
dc.identifier.uri | https://unire.unige.it/handle/123456789/12534 | |
dc.description.abstract | L'Intelligenza Artificiale Generativa (GAI) sta rapidamente cambiando il modo in cui si accede alle informazioni e le si elabora in diversi campi. Tra le sue principali applicazioni, i chatbot intelligenti sono emersi come potenti strumenti per supportare gli utenti in vari scenari, tra cui la navigazione nella documentazione tecnica. Per fornire risposte accurate, questi chatbot si affidano spesso all'approccio RAG (Retrieval-Augmented Generation), che aiuta a mantenere risposte mirate e aggiornate incorporando informazioni da fonti esterne specifiche. Tuttavia, gli approcci RAG tradizionali spesso si basano solo sulla somiglianza semantica per recuperare le informazioni, trascurando la struttura della documentazione e portando potenzialmente a risposte che mancano di completezza semantica. Questa tesi mira a risolvere questo limite proponendo una nuova estensione del framework Graph Retrieval-Augmented Generation (GRAG), specificamente adattata alla documentazione tecnica. L'idea chiave è quella di modellare la documentazione come un grafo, dove i blocchi di testo sono rappresentati come nodi e i collegamenti ipertestuali definiscono le connessioni semantiche tra di essi. Sfruttando questa struttura ipertestuale, introduciamo una strategia di recupero basata su un grafo in grado di attraversare sezioni correlate per arricchire l'input del modello linguistico con informazioni più mirate e contestualizzate. Attraverso un'analisi comparativa, intendiamo dimostrare che l'integrazione delle caratteristiche strutturali dei contenuti tecnici nel processo di reperimento è una direzione promettente per migliorare le prestazioni e la scalabilità dei sistemi RAG in scenari reali. | it_IT |
dc.description.abstract | Generative Artificial Intelligence (GAI) is rapidly changing the way information is accessed and processed across different fields. Among its main applications, intelligent chatbots have emerged as powerful tools to support users in various scenarios, including navigating technical documentation. To provide accurate responses, these chatbots often rely on the Retrieval-Augmented Generation (RAG) approach, which helps maintain focused and up-to-date responses by incorporating information from specific external sources. However, traditional RAG approaches often rely only on semantic similarity for retrieving information, overlooking the structure of the documentation and potentially leading to responses that lack semantic completeness. This thesis aims to address this limitation by proposing a new extension of the Graph Retrieval-Augmented Generation (GRAG) framework, specifically tailored to the technical documentation. The key idea is to model documentation as a graph, where text blocks are represented as nodes and hyperlinks define the semantic connections between them. By leveraging this hypertext structure, we introduce a graph-based retrieval strategy capable of traversing related sections to enrich the input to the language model with more targeted and contextualized information. Through a comparative analysis, we aim to demonstrate that integrating structural features of technical content into the retrieval process is a promising direction to improve the performance and scalability of RAG systems in real world scenarios. | en_UK |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/closedAccess | |
dc.title | Strategia di recupero basata su grafo per sistemi RAG applicati alla documentazione tecnica ipertestuale | it_IT |
dc.title.alternative | Graph-based retrieval strategy for RAG systems in hyperlinked technical documentation | en_UK |
dc.type | info:eu-repo/semantics/masterThesis | |
dc.subject.miur | ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI | |
dc.publisher.name | Università degli studi di Genova | |
dc.date.academicyear | 2024/2025 | |
dc.description.corsolaurea | 11160 - COMPUTER ENGINEERING | |
dc.description.area | 9 - INGEGNERIA | |
dc.description.department | 100023 - DIPARTIMENTO DI INFORMATICA, BIOINGEGNERIA, ROBOTICA E INGEGNERIA DEI SISTEMI |
Files in questo item
Questo item appare nelle seguenti collezioni
-
Laurea Magistrale [6129]