Rilevamento delle Comunità nella Federazione di Mastodon: un approccio basato su grafi e analisi dei contenuti
Author
Seifi, Siamak <1991>
Date
2025-03-26Data available
2025-04-03Abstract
Questa tesi di laurea magistrale analizza la struttura delle comunità nella rete sociale decentralizzata Mastodon. Il calcolo delle comunità nelle reti usa la connettività strutturale ma, nel caso di reti altamente interconnesse come quella che collega le istanze di Mastodon, questo approccio spesso non riesce a rivelare cluster significativi.
Per affrontare questo problema abbiamo dapprima costruito il grafo non pesato per le istanze Mastodon, sul quale abbiamo calcolato alcune proprietà strutturali. I risultati hanno mostrato una scarsa modularità e una separazione limitata tra le comunità, proprio a causa dell'alta densità della rete.
Nella seconda parte della tesi abbiamo progettato una pipeline di elaborazione che ha permesso di generare un grafo pesato. Agli archi del grafo sono stati assegnati dei valori di similarità semantica derivati analizzando i post più importanti in ciascuna istanza. L'efficacia di questo approccio basato sul contenuto è stata valutata utilizzando algoritmi di calcolo delle comunità per i quali si è potuto osservare un aumento della modularità e, di conseguenza, della granularità delle comunità rispetto al caso del grafo non pensato.
Questo progetto contribuisce allo studio delle comunità che si possono trovare nelle reti sociali decentralizzate grazie all’uso della similiarità semantica dei contenuti. I risultati ottenuti migliorano la comprensione delle reti sociali decentralizzate e offrono una base per ulteriori ricerche sull'impatto della simililarità semantica nell'identificazione delle comunità. This Master's thesis investigates community detection in the Mastodon decentralized network by integrating content-based edge weighting to enhance modularity maximization techniques. Traditional community detection relies on structural connectivity, but in highly interconnected networks like Mastodon, this approach often fails to reveal meaningful clusters. To address this, an unweighted graph of Mastodon instances was first constructed using federation links and analyzed for structural properties. The results showed poor modularity and limited community separation due to high interconnectivity.
To overcome this limitation, a preprocessing pipeline was designed to generate a weighted graph by assigning semantic similarity scores to edges, derived from trending posts. The effectiveness of this content-aware approach was evaluated using Louvain and Leiden algorithms, showing a notable increase in modularity and community granularity compared to traditional unweighted methods.
This study contributes to the field of community detection in decentralized networks by exploring the use of content-aware edge weighting, which provides insights into community structures shaped by semantic relationships. The findings enhance the understanding of decentralized social networks and offer a basis for further research into the impact of content similarity on community dynamics.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [5638]