Analisi bayesiana dei changepoints in serie temporali: individuazione di pattern di influenza tra sequenze
Mostra/ Apri
Autore
Arduini, Lisa <2003>
Data
2025-09-26Disponibile dal
2025-10-02Abstract
In questo elaborato si affronta l’algoritmo del bayesian online changepoint detection (BOCPD), finalizzato a stabilire in tempo reale i momenti in cui si verificano cambiamenti in una sequenza di dati nel tempo, quantificando il grado di incertezza esistente, oltre a effettuare previsioni sui dati immediatamente successivi.
Si spiegano le basi teoriche necessarie a comprendere la struttura dell’algoritmo, quali i concetti di distribuzione a priori e a posteriori nella statistica bayesiana, la definizione di distribuzioni coniugate in un modello di classe esponenziale e l’hazard rate. Si introducono inoltre le nozioni di correlazione e causalità tra variabili statistiche, soffermandosi sulla differenza che sussiste tra esse.
Dopodiché si descrive nel dettaglio l’algoritmo BOCPD, mostrando come sia possibile ricavare la distribuzione predittiva del nuovo dato e la distribuzione a posteriori di particolari sottosequenze di dati dette run length, tramite l’applicazione di un algoritmo ricorsivo. Ci si concentra sul caso in cui si operi con distribuzioni appartenenti alla famiglia esponenziale, illustrando in che modo questo consenta di semplificare notevolmente i calcoli.
Si definiscono infine le strutture a grafo, facendo riferimento alle loro caratteristiche principali: esse risultano utili per sviluppare alcune considerazioni finali, relativamente a un esempio pratico di applicazione del BOCPD nell’ambito di un processo di produzione industriale, del quale si riportano i risultati di maggiore interesse. This paper discusses the bayesian online changepoint detection (BOCPD) algorithm, which is used to determine in real time the moments when changes occur in a sequence of data over time, quantifying the degree of uncertainty, and making predictions about the data that follows immediately.
The theoretical foundations necessary to understand the algorithm's structure are explained, such as the concepts of prior and posterior distributions in bayesian statistics, the definition of conjugate distributions in an exponential class model, and the hazard rate. The notions of correlation and causality between statistical variables are also introduced, focusing on the difference between them.
The BOCPD algorithm is then described in detail, showing how to derive the predictive distribution of new data and the posterior distribution of particular data subsequences, called run lengths, through the application of a recursive algorithm. We focus on the case of exponential family distributions, illustrating how this allows to simplify the calculations significantly.
Finally, graph structures are defined, referring to their main characteristics: they are useful for developing some final considerations, relating to a practical example of BOCPD application in an industrial production process, of which the most interesting results are reported.
Tipo
info:eu-repo/semantics/bachelorThesisCollezioni
- Laurea Triennale [3339]