Tecniche di imputazione multipla per gestire i dati mancanti in grandi dataset.

Mostra/ Apri
Autore
Olcese, Gianluca <1999>
Data
2023-07-12Disponibile dal
2024-07-20Abstract
Nella letteratura degli ultimi decenni, l'occorrenza di dati mancanti ha rappresentato un problema importante in vari campi di ricerca. Considerando che una perdita parziale di informazioni che interessano il set di dati in analisi può rappresentare un vincolo rilevante quando si conduce una procedura inferenziale, tale argomento è stato negli ultimi anni - ed è tuttora - un argomento di discussione rilevante e comune in letteratura.
La prima parte di questo lavoro ha l'obiettivo di fornire una breve panoramica dei principali tipi di dati mancanti e dei meccanismi che possono essere responsabili di tali valori mancanti. Dato che lo scopo di una metodologia di inferenza è ottenere risultati non distorti, è particolarmente rilevante analizzare metodi statistici che consentano di gestire i dati mancanti e di ottenere i risultati non distorti desiderati. La seconda sezione di questo lavoro fornisce quindi una panoramica delle principali tecniche di imputazione singola, che sono in grado di colmare i valori mancanti mediante l'uso di diverse tecniche statistiche. Una metodologia di imputazione più complessa e accurata è poi rappresentata dalla procedura di imputazione multipla, presentata nel capitolo III, che può essere applicata anche a diverse tipologie di dati come spiegato nell'ultima sezione di questo lavoro. In recent decades’ literature, missing data occurrence represented a major issue in various fields of research. Considering that a partial loss of information affecting the dataset under analysis may represent a relevant constraint when conducting an inferential procedure, such topic has been in the recent years – and is still nowadays – a relevant and common topic of discussion in the literature.
The first part of this work has the objective the provide a brief overview of the main types of missing data and of the mechanisms which may be responsible of such missing values. Given that the aim of an inference methodology is to obtain unbiased results, it is particularly relevant to analyze statistical methods which allow to handle missing data and to obtain such desired unbiased figures. The second section of this paper provides therefore an overview of the main single imputation techniques, which are able to fill in the missing values by the use of a number of different statistical techniques. A more complex and accurate imputation methodology is then represented by the multiple imputation procedure, presented in chapter III, which may also be applied to different types of data as explained in the last section of this paper.
Tipo
info:eu-repo/semantics/masterThesisCollezioni
- Laurea Magistrale [5671]