Implementazione di un modello di apprendimento federato per l'identificazione multicentrica delle cellule del sangue periferico
View/ Open
Author
Natali, Lorenzo <2000>
Date
2024-10-15Data available
2024-10-17Abstract
L’analisi morfologica del sangue periferico permette di identificare l’80% delle malattie
ematologiche. Questo processo viene effettuato utilizzando analizzatori morfologici che,
nell’ultimo decennio, hanno integrato sistemi di classificazione automatica per facilitare
l’identificazione di diversi tipi di cellule. Utilizzando le immagini generate da questi
dispositivi, è possibile addestrare e testare modelli di machine learning che identificano
automaticamente le morfologie cellulari, fungendo da strumenti di supporto per il
patologo clinico. Tuttavia, le immagini ottenute possono variare da un centro all’altro a
causa di fattori quali la preparazione del campione, la concentrazione dei reagenti chimici
o l’uso di diversi analizzatori morfologici disponibili sul mercato. Sebbene la variabilità
delle immagini non influisca in genere sulla diagnosi formulata dal patologo clinico, essa
può compromettere le prestazioni dei sistemi di classificazione automatica, che possono
faticare a classificare correttamente le immagini che presentano differenze significative
rispetto a quelle utilizzate durante l’addestramento.
Per affrontare questa sfida, l’obiettivo di questo lavoro è sviluppare un classificatore
automatico per identificare le immagini di cellule multicentriche utilizzando
l’apprendimento federato. Questa metodologia consente a un modello addestrato con
immagini provenienti da un centro di riferimento, in questo caso il Core Laboratory
dell’Hospital Clínic di Barcellona, di regolare e mantenere le proprie prestazioni in diversi
centri. L’implementazione di questa metodologia si è concentrata su un classificatore
automatico per i leucociti, cellule normali del sangue periferico. A tal fine, sono stati
compilati un set di dati del centro di riferimento con 10298 immagini e quattro database
pubblici: C1 con 14514 immagini, C2 con 2513 immagini, C3 con 5000 immagini e C4
con 11353 immagini. Ogni database contiene immagini di cinque tipi di leucociti:
linfociti, monoci The morphological analysis of peripheral blood allows the identification of 80% of
hematological diseases. This process is carried out using morphological analyzers that,
over the past decade, have integrated automatic classification systems to facilitate the
identification of different types of cells. By using the images generated by these devices,
it is possible to train and test machine learning models that automatically identify cell
morphologies, serving as support tools for the clinical pathologist. However, the images
obtained may vary between centres due to factors such as sample preparation, the
concentration of chemical reagents, or the use of different morphological analyzers
available on the market. Although variability in the images generally does not affect the
diagnosis made by a clinical pathologist, it can compromise the performance of automatic
classification systems, as they may struggle to correctly classify images that show
significant differences from those used during their training.
To address this challenge, the objective of this work is to develop an automatic classifier
to identify multicentric cell images using federated learning. This methodology allows a
model trained with images from a reference centre, in this case, the Core Laboratory of
the Hospital Clínic of Barcelona, to adjust and maintain its performance across different
centres. The implementation of this methodology has focused on an automatic classifier
for leukocytes, normal cells of peripheral blood. For this purpose, a dataset from the
reference centre with 10298 images was compiled, along with four public databases: C1
with 14514 images, C2 with 2513 images, C3 with 5000 images, and C4 with 11353
images. Each database contains images of five types of leukocytes: lymphocytes,
monocytes, eosinophils, basophils, and neutrophils. The peripheral blood smears were
stained using the May Grünwald-Giemsa (MGG) technique, and the images from the
reference centre were acquired using
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [5096]