Apprendimento automatico delle relazioni fra documenti dal web
View/ Open
Author
Riva, Davide <1995>
Date
2020-10-29Data available
2020-11-05Abstract
L'inferenza di reti è il processo mediante il quale si rivelano le relazioni tra i dati, particolarmente efficace in biologia per ricostruire le Gene Regulatory Networks (GRN).
In passato sono stati proposti metodi supervisionati per modellare un grafo di documenti, predicendo quindi i link.
In questa tesi proponiamo un approccio non supervisionato per estrarre un grafo non diretto e non pesato data una collezione di documenti. In particolare presentiamo una pipeline per costruire ed usare un dataset composto da pagine di un dato sito web. Network inference is the process of uncovering relations between data, particularly effective in biology to reconstruct Gene Regulatory Networks (GRN). Supervised methods were also proposed in the past to model a network of documents and predict links between them.
In this thesis, we propose an unsupervised approach to extract an undirected and unweighted graph given a collection of texts.
In particular, we present a pipeline to construct and use a dataset composed of pages of a given website.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [4954]