Show simple item record

dc.contributor.advisorRapallo, Fabio <1976>
dc.contributor.authorConsogno, Greta <2001>
dc.date.accessioned2025-10-23T14:27:02Z
dc.date.available2025-10-23T14:27:02Z
dc.date.issued2025-10-20
dc.identifier.urihttps://unire.unige.it/handle/123456789/13365
dc.description.abstractI dati composizionali sono costituiti da osservazioni multivariate in cui ciascun componente rappresenta una parte di un insieme, fornendo un’informazione di natura puramente proporzionale. A causa del vincolo di somma costante che li caratterizza, l’applicazione diretta dei metodi statistici multivariati tradizionali può produrre risultati distorti o incoerenti. Per superare tale limitazione, si adotta un quadro algebrico–geometrico noto come geometria di Aitchison, nel quale le trasformazioni dei rapporti logaritmici consentono di mappare i dati in uno spazio euclideo reale, permettendo l’utilizzo di tecniche statistiche convenzionali nel rispetto delle proprietà fondamentali di invarianza di scala, invarianza per permutazione e coerenza subcomposizionale. Uno degli aspetti centrali di questo lavoro riguarda l’analisi di cluster, una tecnica esplorativa che consente di raggruppare le osservazioni in base alla loro somiglianza. Nel contesto dei dati composizionali, il clustering è eseguito utilizzando coordinate o distanze trasformate mediante logratio, così da rispettare la geometria intrinseca dei dati e preservarne la struttura relativa. Infine, la metodologia è applicata a un dataset di microbiota, con l’obiettivo di identificare e analizzare i cluster per individuare i phyla microbici che differenziano i diversi gruppi. I risultati dimostrano come l’integrazione tra i principi dell’analisi dei dati composizionali e i metodi di clustering permetta di rivelare pattern biologicamente significativi, offrendo al contempo un approccio rigoroso e interpretabile allo studio dei fenomeni composizionali.it_IT
dc.description.abstractCompositional data consist of multivariate observations where each component represents part of a whole, conveying purely proportional information. Due to their constant-sum constraint, applying standard multivariate methods directly can lead to distorted or biased results. To address this, an algebraic–geometrical framework known as Aitchison geometry is employed. In this framework, logratio transformations map data into real Euclidean space, enabling the use of conventional statistical techniques while preserving key properties, such as scale invariance, permutation invariance, and subcompositional coherence. This theoretical foundation offers a rigorous and interpretable approach to analysing compositional phenomena. A primary focus of this thesis is on cluster analysis, an exploratory technique that groups observations based on their similarity. In the context of compositional data, clustering is performed using logratio-transformed coordinates or distances that respect the underlying geometry, ensuring the results align with the relative structure of the data. Finally, this work demonstrates the application of the methodology to a microbiota dataset, where clusters are identified and examined to detect microbial phyla that distinguish between groups. The findings demonstrate how integrating principles of compositional data analysis with clustering methods can reveal biologically significant patterns.en_UK
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.titleMetodi multivariati per dati composizionaliit_IT
dc.title.alternativeMultivariate techniques for compositional dataen_UK
dc.typeinfo:eu-repo/semantics/masterThesis
dc.subject.miurSECS-S/01 - STATISTICA
dc.publisher.nameUniversità degli studi di Genova
dc.date.academicyear2024/2025
dc.description.corsolaurea11267 - ECONOMICS AND DATA SCIENCE
dc.description.area28 - ECONOMIA
dc.description.department100012 - DIPARTIMENTO DI ECONOMIA


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record