Navigazione Semantica ad Obiettivo su un Robot Quadrupede in Ambienti Conosciuti

View/ Open
Author
Razavi, Seyed Emad <1999>
Date
2025-12-18Data available
2026-01-22Abstract
Questa tesi presenta una pipeline pratica per la navigazione object-goal di un robot quadrupede in ambienti indoor reali. Il flusso di lavoro ha due fasi. Nella prima, un operatore teleopera il robot per un breve tratto mentre SLAM Toolbox costruisce una mappa di occupazione 2D e lo stack semantico gira in parallelo. Un detector elabora immagini RGB-D; le rilevazioni confermate vengono fuse con la profondità, proiettate nel frame mappa e scritte sulla griglia come strato semantico di istanze etichettate. Al termine, mappa 2D e database semantico vengono salvati. Nella seconda fase, durante l’operazione, l’utente seleziona un target dalla lista degli oggetti registrati (ad es. una sedia o una persona). Un piccolo client da riga di comando recupera l’istanza scelta nel database semantico e invia l’obiettivo al navigatore.
La navigazione usa una costmap a strati: la mappa statica della fase di mappatura, uno strato ostacoli da laser 2D e l’inflation per mantenere un margine di sicurezza attorno a persone e ostacoli. Un pianificatore globale classico imposta il percorso e un controllore locale lo segue entro limiti di velocità e accelerazione. Ci concentriamo sull’integrazione, non su nuovi metodi; strumenti standard forniscono mappatura e localizzazione. Durante la navigazione non eseguiamo SLAM; il robot si localizza solo su questa mappa a griglia precomputata.
Tutti i componenti girano su un computer a bordo compatto, senza GPU dedicata. Un piccolo strato di supervisione gestisce target persi, occlusioni brevi e semplici azioni di recupero, così che il comportamento resti stabile e spiegabile. Nonostante i limiti, il lavoro rappresenta il primo tentativo nel nostro laboratorio di abilitare la navigazione autonoma per Boston Dynamics Spot usando solo sensori e calcolo a bordo. Con uno strato semantico a oggetti sopra la griglia di occupazione, il robot può anche navigare verso classi mappate, invece di seguire solo comandi di posa specificati manualmente. This thesis presents a practical pipeline for object-goal navigation on a quadruped robot in real indoor spaces. The workflow has two stages. In the first stage, an operator teleoperates the robot along a short trajectory while SLAM Toolbox builds a two-dimensional occupancy grid, and the semantic stack runs in parallel. An object detector processes RGB-D images, confirmed detections are fused with depth and projected into the map frame, and they are written onto the grid as a semantic layer of labelled object instances. At the end of this run, both the 2D map and the semantic database are saved. In the second stage, during operation, a user selects a target from the list of recorded objects (e.g., a chair or a person). A small command-line client looks up the chosen instance in the semantic database and sends this goal to the navigator.
Navigation uses a layered costmap: the static map from the mapping stage, an obstacle layer from a two-dimensional laser scanner, and inflation that keeps a safe margin around people and obstacles. A classical global planner sets the path, and a local controller tracks it within speed and acceleration limits. We focus on integration, not on new methods; standard tools provide mapping and localization. During navigation, we do not run SLAM; the robot only localizes on this precomputed grid map.
All components run on a compact onboard computer mounted on the quadruped robot, with no discrete graphics card. A small supervision layer handles lost targets, short-term occlusions, and simple recovery actions so behavior remains steady and explainable. Despite its limitations, the work represents the first attempt in our lab to enable autonomous navigation for the Boston Dynamics Spot robot using only onboard sensing and computation. By adding an object-based semantic layer on top of the occupancy grid, the robot can also navigate goal-orientedly towards mapped object classes, rather than only following manually specified pose commands.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [6793]

