Sviluppo e Benchmarking di una pipeline automatizzata per l'analisi metabarcoding del gene 16S rRNA
Author
Eldomiaty, Ghada <2000>
Date
2024-12-06Data available
2024-12-12Abstract
In questa tesi abbiamo sviluppato una pipeline completamente automatizzata per l’analisi
metabarcoding del gene marker 16S rRNA che codifica per la subunità 16S del ribosoma. Il
gene 16S rRNA si trova in tutti i batteri e gli archaea ed è altamente conservato, rendendolo un
bersaglio ideale per identificare e caratterizzare microrganismi.La tecnica del metabarcoding
viene impiegata per analizzare, nel nostro caso la biodiversità di comunità microbiche tramite
amplificazione di una regione target del DNA.Questo tipo di analisi comprende varie fasi, che
includono: il campionamento, l'estrazione del DNA, l’amplificazione della regione target, il
sequenziamento e l’analisi bioinformatica.
In questa tesi, ci siamo concentrati sull’analisi bioinformatica attraverso lo sviluppo di una
pipeline automatizzata in grado, a partire dalle sequenze, di produrre gli output standard
dell’analisi metabarcoding: la tabella delle frequenze e la tassonomia dei taxa presenti nei
campioni. Infine, abbiamo fatto il benchmarking, ossia il confronto tra due pipeline diverse per
comparare 1) il tempo totale di esecuzione, 2) le differenze nella composizione batterica dei
taxa più abbondanti e 3) la percentuale di reads mantenute. In this thesis we developed a fully automated pipeline for the metabarcoding analysis of the
16S rRNA marker gene that codes for the 16S subunit of the ribosome. The 16S rRNA gene is
found in all bacteria and archaea, and is highly conserved, making it an ideal target for
identifying and characterizing microorganisms. The metabarcoding technique is used to
analyze, in our case, the biodiversity of microbial communities through the amplification of a
target DNA region. This type of analysis includes various phases, which comprise: sampling,
DNA extraction, target region amplification, sequencing, and bioinformatic analysis.
In this thesis, we focused on bioinformatic analysis through the development of an automated
pipeline capable of producing the standard outputs of metabarcoding analysis from the
sequences: the frequency table and the taxonomy of the taxa present in the samples.
Finally, we performed benchmarking, that is the comparison between two different pipelines
to compare 1) the total execution time, 2) differences in the bacterial composition of the most
abundant taxa and 3) the percentage of retained reads.
Type
info:eu-repo/semantics/bachelorThesisCollections
- Laurea Triennale [2475]