Apprendimento auto-supervisionato in-domain per classificazione di immagini di plankton

Gjergji, Ani <1998>

Autore

Gjergji, Ani <1998>

Data

2024-03-27

Disponibile dal

2024-04-04

Abstract

Questo studio esplora l'applicazione dell'apprendimento auto-supervisionato in dominio per la classificazione delle immagini di plancton, affrontando la sfida critica dei costi di annotazione dei dati e dell'efficienza del modello in uno scenario di budget limitato. I metodi tradizionali di apprendimento supervisionato, benché efficaci, richiedono ampie serie di dati etichettati, che sono costosi e lunghi da produrre, soprattutto in campi specializzati come la biologia marina. La nostra ricerca studia una modalità di apprendimento auto-supervisionato che sfrutta la struttura intrinseca delle immagini di plancton non etichettate per apprendere rappresentazioni significative senza la necessità di set di dati annotati. Abbiamo dimostrato che l'apprendimento auto-supervisionato supera le sue controparti supervisionate in compiti di classificazione di immagini di plancton, in particolare quando le risorse di annotazione sono limitate. Abbiamo inoltre analizzato il pre-allenamento auto-supervisionato in dominio sfruttando set di dati di immagini di plancton su larga scala, ottenendo un miglioramento di circa il 2% rispetto al miglior modello auto-supervisionato su ImageNet. Anche se sono necessari ulteriori approfondimenti, riteniamo che la nostra ricerca possa fornire spunti fondamentali per strategie di pre-addestramento in dominio, nello scenario fondamentale di risorse limitate e di analisi di immagini di plancton in-situ.

This study explores the application of in-domain self-supervised learning for the classification of plankton images, addressing the critical challenge of data annotation costs and model efficiency within a constrained budget scenario. Traditional supervised learning methods, although effective, require extensive labeled datasets, which are costly and time-consuming to produce, especially in specialized fields like marine biology. Our research investigates a self-supervised learning framework that leverages the intrinsic structure of unlabeled plankton imagery to learn meaningful representations without the need for extensive annotated data sets. We demonstrate that self-supervised learning outperforms its supervised counterparts in plankton image classification tasks, particularly when annotation resources are limited. We further investigate in-domain self-supervised pre-training exploiting large-scale plankton image datasets, obtaining an improvement of about 2% with respect to the best ImageNet self-supervised model. Even if further work is necessary, we believe that our research may provide fundamental insights toward in-domain pre-training strategies, in the fundamental scenario of budgeted resources and in-situ plankton image analysis.

Tipo

info:eu-repo/semantics/masterThesis