Reti convoluzionali a basso costo computazionale per l'elaborazione di segnali video
View/ Open
Author
Lugani, Simone <2001>
Date
2023-07-21Data available
2023-07-27Abstract
In questa tesi vengono analizzati e proposti diversi approcci e modelli per l’elaborazione di immagini a basso costo computazionale, con particolare attenzione al problema dell’affordance segmentation. Con questo termine si indica la capacità di riconoscere in quale modo un oggetto possa essere manipolato, in base alle sue caratteristiche. Quello dell’affordance segmentation è un tema molto importante nell’ambito della robotica e della computer vision. Nel caso trattato, il problema affrontato sarà la segmentazione dell’oggetto da una sua immagine e il riconoscimento delle sue parti afferrabili mediante l’utilizzo di reti neurali artificiali. Verranno in primo luogo studiati i benefici apportati da tecniche di data augmentation. Successivamente verranno proposte diverse architetture con bassi requisiti computazionali andando a lavorare sulla struttura del blocco decoder del grafo computazionale corrispondente. Un'estensiva campagna sperimentale su dataset noti in letteratura ha permesso di valutare in dettaglio l’effetto delle tecniche testate nel bilanciare l’accuratezza dei modelli e i loro requisiti computazionali. In this thesis, different approaches and models for image processing at low computational cost are analyzed and proposed, with a focus on the problem of affordance segmentation. This term refers to the ability to recognize in which way an object can be manipulated, based on its characteristics. That of affordance segmentation is a very important issue in the field of robotics and computer vision. In the case discussed, the problem addressed will be the segmentation of the object from its image and the recognition of graspable parts using artificial neural networks. The benefits brought by data augmentation techniques will be studied first. Then different architectures with low computational requirements will be proposed by working on the structure of the decoder block of the corresponding computational graph. An extensive experimental campaign on datasets known in literature allowed to evaluate in detail the effect of the tested techniques in balancing the accuracy of the models and their computational requirements.
Type
info:eu-repo/semantics/bachelorThesisCollections
- Laurea Triennale [2887]