Università di Genova logo, link al sitoUniRe logo, link alla pagina iniziale
    • English
    • italiano
  • English 
    • English
    • italiano
  • Login
View Item 
  •   DSpace Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • View Item
  •   DSpace Home
  • Tesi
  • Tesi di Laurea
  • Laurea Magistrale
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Metodi multivariati per dati composizionali

Thumbnail
View/Open
tesi35141837.pdf (3.503Mb)
Author
Consogno, Greta <2001>
Date
2025-10-20
Data available
2025-10-23
Abstract
I dati composizionali sono costituiti da osservazioni multivariate in cui ciascun componente rappresenta una parte di un insieme, fornendo un’informazione di natura puramente proporzionale. A causa del vincolo di somma costante che li caratterizza, l’applicazione diretta dei metodi statistici multivariati tradizionali può produrre risultati distorti o incoerenti. Per superare tale limitazione, si adotta un quadro algebrico–geometrico noto come geometria di Aitchison, nel quale le trasformazioni dei rapporti logaritmici consentono di mappare i dati in uno spazio euclideo reale, permettendo l’utilizzo di tecniche statistiche convenzionali nel rispetto delle proprietà fondamentali di invarianza di scala, invarianza per permutazione e coerenza subcomposizionale. Uno degli aspetti centrali di questo lavoro riguarda l’analisi di cluster, una tecnica esplorativa che consente di raggruppare le osservazioni in base alla loro somiglianza. Nel contesto dei dati composizionali, il clustering è eseguito utilizzando coordinate o distanze trasformate mediante logratio, così da rispettare la geometria intrinseca dei dati e preservarne la struttura relativa. Infine, la metodologia è applicata a un dataset di microbiota, con l’obiettivo di identificare e analizzare i cluster per individuare i phyla microbici che differenziano i diversi gruppi. I risultati dimostrano come l’integrazione tra i principi dell’analisi dei dati composizionali e i metodi di clustering permetta di rivelare pattern biologicamente significativi, offrendo al contempo un approccio rigoroso e interpretabile allo studio dei fenomeni composizionali.
 
Compositional data consist of multivariate observations where each component represents part of a whole, conveying purely proportional information. Due to their constant-sum constraint, applying standard multivariate methods directly can lead to distorted or biased results. To address this, an algebraic–geometrical framework known as Aitchison geometry is employed. In this framework, logratio transformations map data into real Euclidean space, enabling the use of conventional statistical techniques while preserving key properties, such as scale invariance, permutation invariance, and subcompositional coherence. This theoretical foundation offers a rigorous and interpretable approach to analysing compositional phenomena. A primary focus of this thesis is on cluster analysis, an exploratory technique that groups observations based on their similarity. In the context of compositional data, clustering is performed using logratio-transformed coordinates or distances that respect the underlying geometry, ensuring the results align with the relative structure of the data. Finally, this work demonstrates the application of the methodology to a microbiota dataset, where clusters are identified and examined to detect microbial phyla that distinguish between groups. The findings demonstrate how integrating principles of compositional data analysis with clustering methods can reveal biologically significant patterns.
 
Type
info:eu-repo/semantics/masterThesis
Collections
  • Laurea Magistrale [6529]
URI
https://unire.unige.it/handle/123456789/13365
Metadata
Show full item record

UniRe - Università degli studi di Genova | Information and Contacts
 

 

All of DSpaceCommunities & Collections

My Account

Login

UniRe - Università degli studi di Genova | Information and Contacts