Università di Genova logo, link al sitoUniRe logo, link alla pagina iniziale
    • English
    • italiano
  • italiano 
    • English
    • italiano
  • Login
Mostra Item 
  •   Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • Mostra Item
  •   Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • Mostra Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Sistema on-premise di Retrieval-Augmented Generation per il troubleshooting industriale su documenti tecnici multimodali

Mostra/Apri
tesi37309904.pdf (1.099Mb)
Autore
Parto, Keyvan <1991>
Data
2026-03-23
Disponibile dal
2026-03-26
Abstract
La moderna manutenzione industriale si basa sulla capacità degli operatori di accedere rapidamente a informazioni tecniche precise, spesso sepolte all'interno di una mole di documentazione non strutturata. Le tradizionali soluzioni di ricerca basate su parole chiave si rivelano insufficienti di fronte alla complessità di questi documenti, mentre l'adozione dell'IA Generativa in cloud è spesso preclusa da rigidi requisiti di riservatezza dei dati e di sovranità dell'infrastruttura. Questa tesi propone un'architettura RAG (Retrieval-Augmented Generation) On-Premise, progettata specificamente per il supporto alla manutenzione ferroviaria (Hitachi Rail). A differenza degli approcci standard di "Naive RAG", che frammentano il testo in segmenti arbitrari, il sistema introduce un innovativo Parser Multimodale Gerarchico (Hierarchical Multimodal Parser). Questo modulo decostruisce complessi manuali in formato PDF, preservando le relazioni logiche tra capitoli, procedure, tabelle e diagrammi tecnici. L'architettura implementa una strategia di ricostruzione del contesto che, invece di recuperare frammenti isolati, ricostruisce l'intera unità logica (ad esempio, una procedura di manutenzione completa), garantendo che il Large Language Model riceva un contesto sequenziale e coerente. Il sistema è stato validato attraverso una pipeline automatizzata "LLM-as-a-Judge", dimostrando un aumento significativo nell'accuratezza del recupero procedurale. L'architettura gerarchica iniziale ha raggiunto un'accuratezza del 70% rispetto a una baseline del 20%, mentre l'introduzione di un modulo di reranking basato su Cross-Encoder ha ulteriormente migliorato le prestazioni portandole al 90%. Oltre alle metriche sperimentali, l'efficacia della soluzione è stata dimostrata attraverso due applicazioni industriali nel mondo reale: un'interfaccia di assistenza interattiva per gli operatori e un sistema di arricchimento automatizzato per il database degli allarmi di manutenzione.
 
Modern industrial maintenance relies on the ability of operators to rapidly access precise technical information, often buried within massive, unstructured documentation. Traditional keyword-based search solutions prove insufficient when facing the complexity of these documents, while the adoption of cloud-based Generative AI is often precluded by strict data confidentiality and infrastructure sovereignty requirements. This thesis proposes an On-Premise Retrieval-Augmented Generation (RAG) architecture, specifically designed for railway maintenance support (Hitachi Rail). Unlike standard “Naive RAG" approaches that fragment text into arbitrary segments, the system introduces a novel Hierarchical Multimodal Parser. This module deconstructs complex PDF manuals while preserving the logical relationships between chapters, procedures, tables, and technical diagrams. The architecture implements a context reconstruction strategy that, rather than retrieving isolated fragments, reconstructs the entire logical unit (e.g., a complete maintenance procedure), ensuring that the Large Language Model receives a sequential and coherent context. The system was validated through an automated LLM-as-a-Judge pipeline, demonstrating a significant increase in procedural retrieval accuracy. The initial hierarchical architecture achieved a 70% accuracy compared to a 20% baseline, while the introduction of a Cross-Encoder reranking module further improved the performance to 90%. Beyond experimental metrics, the solution's effectiveness was demonstrated through two real-world industrial applications: an interactive assistance interface for operators and an automated enrichment system for the maintenance alarm database, transforming static documentation into actionable knowledge.
 
Tipo
info:eu-repo/semantics/masterThesis
Collezioni
  • Laurea Magistrale [7402]
URI
https://unire.unige.it/handle/123456789/15290
Metadati
Mostra tutti i dati dell'item

UniRe - Università degli studi di Genova | Informazioni e Supporto
 

 

UniReArchivi & Collezioni

Area personale

Login

UniRe - Università degli studi di Genova | Informazioni e Supporto