dc.contributor.advisor | Grassi, Lucrezia <1996> | |
dc.contributor.advisor | Sgorbissa, Antonio <1970> | |
dc.contributor.author | Meschini, Marco <2001> | |
dc.contributor.other | Enzo Ubaldo Petrocco | |
dc.date.accessioned | 2025-09-11T14:10:59Z | |
dc.date.available | 2025-09-11T14:10:59Z | |
dc.date.issued | 2025-09-04 | |
dc.identifier.uri | https://unire.unige.it/handle/123456789/12817 | |
dc.description.abstract | Lo sviluppo di robot general-purpose rappresenta una pietra miliare fondamentale nell’avanzamento della robotica, offrendo un’ampia applicabilità nei domini industriali, assistivi e orientati ai servizi. Il raggiungimento di questo obiettivo richiede sistemi capaci di percepire, ragionare e interagire autonomamente con l’ambiente. Questa tesi presenta un’architettura cognitiva progettata per soddisfare questi requisiti fondamentali e operare in ambienti non strutturati e dinamici. L’architettura integra un modello visione-linguaggio e un rilevatore di oggetti a vocabolario aperto per generare grafi della scena semanticamente ricchi. Sebbene questo approccio sia robusto per la fase percettiva, i modelli linguistici presentano difficoltà nelle capacità di ragionamento. Per questa limitazione, viene utilizzato un pianificatore simbolico per ragionare sulla rappresentazione del mondo e generare piani orientati agli obiettivi. L’architettura è dotata di un’interfaccia multimodale che supporta l’interazione in linguaggio naturale, permettendo al sistema di comprendere le istruzioni dell’utente e comunicare stati interni o progressi del compito attraverso la voce. I piani simbolici di alto livello sono tradotti in azioni motorie eseguibili, consentendo al robot di svolgere compiti nel mondo reale. L’efficacia dell’architettura è validata attraverso una serie di esperimenti in scenari generali che simulano una collaborazione realistica tra uomo e robot. I risultati dimostrano la capacità del sistema di percepire ambienti nuovi, adattare i piani ai cambiamenti dinamici e fornire un’assistenza significativa ai compiti. | it_IT |
dc.description.abstract | The development of general-purpose robots represents a fundamental milestone in the advancement of robotics, offering broad applicability in industrial, assistive, and service-oriented domains. Achieving this objective requires systems capable of perceiving, reasoning, and interacting autonomously with the environment. This thesis presents a cognitive architecture designed to meet these core requirements and operate in unstructured and dynamic environments. The architecture integrates a vision-language model and an open-vocabulary object detector to generate semantically rich scene graphs. While this approach is robust for the perceptual stage, language models struggle in reasoning capabilities. For this limitation, a symbolic planner is used to reason on the world representation and generate goal-oriented plans. The architecture is endowed with a multimodal interface that supports natural language interaction, allowing the system to understand user instructions and convey internal states or task progress through speech. High-level symbolic plans are translated into executable motor actions, enabling the robot to perform real-world tasks. The efficacy of the architecture is validated through a series of experiments in open-ended scenarios simulating realistic human-robot collaboration. Results demonstrate the system’s ability in perceiving novel environments, adapting plans to dynamic changes, and providing meaningful task assistance. | en_UK |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.title | Integrazione dei Foundation Models nelle Architetture Cognitive: Percezione e Pianificazione in Ambienti Dinamici e Non Strutturati | it_IT |
dc.title.alternative | Integrating Foundation Models within Cognitive Architectures: Perception and Planning in Dynamic and Unstructured Environments | en_UK |
dc.type | info:eu-repo/semantics/masterThesis | |
dc.subject.miur | ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI | |
dc.subject.miur | ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI | |
dc.subject.miur | ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI | |
dc.publisher.name | Università degli studi di Genova | |
dc.date.academicyear | 2024/2025 | |
dc.description.corsolaurea | 10635 - ROBOTICS ENGINEERING | |
dc.description.area | 9 - INGEGNERIA | |
dc.description.department | 100023 - DIPARTIMENTO DI INFORMATICA, BIOINGEGNERIA, ROBOTICA E INGEGNERIA DEI SISTEMI | |