Migliorare la Qualità dei Dati di Osservazione Oceanografic.
View/ Open
Author
Riazi, Sahel <1984>
Date
2025-03-27Data available
2025-04-03Abstract
L’oceano svolge un ruolo essenziale nella regolazione del clima terrestre, nel supporto di ecosistemi diversificati e nella facilitazione di attività economiche come la pesca, la produzione di energia e il trasporto marittimo. Tuttavia, i dati osservativi oceanografici presentano spesso valori mancanti a causa di malfunzionamenti dei sensori, disturbi ambientali e guasti nella trasmissione dei dati. Queste lacune possono compromettere l’accuratezza della modellazione climatica, delle previsioni meteorologiche e dell’analisi degli ecosistemi marini. La gestione efficace dei dati mancanti è quindi fondamentale per migliorare l'affidabilità e l’usabilità dei dataset oceanici.
Questa tesi esplora il problema dell’imputazione dei dati mancanti nei dataset oceanografici basati su serie temporali, con particolare attenzione alle misurazioni della temperatura del mare. Viene presentato uno studio comparativo di diverse metodologie di imputazione, tra cui approcci basati sull’apprendimento profondo (Self-Attention-based Imputation for Time Series (SAITS), Bidirectional Generative Adversarial Networks (Bi-GAN) e metodi basati su PyPOTS), nonché reti generative avversarie (GANs). I dataset utilizzati in questa ricerca provengono da piattaforme di monitoraggio oceanografico come EMODnet e il Copernicus Marine Service, che forniscono dati univariati e multivariati su serie temporali raccolti da diverse profondità e località.
Una delle principali sfide nell’imputazione dei dati oceanografici riguarda la gestione di intervalli temporali irregolari, tassi elevati di dati mancanti e dipendenze tra variabili multiple. Questa ricerca utilizza scenari di dati mancanti sia sintetici che reali per valutare le prestazioni delle diverse tecniche di imputazione. La valutazione sperimentale pianificata confronterà i metodi sulla base di metriche chiave di performance, come l'errore assoluto medio (MAE) e l’errore quadratico medio (RMSE), oltre a misure avanzate come il coefficiente di dete The ocean is essential for regulating the Earth's climate, supporting diverse ecosystems, and facilitating economic activities like fisheries, energy production, and transportation. However, oceanographic observation data often have missing values due to sensor malfunctions, environmental disturbances, and transmission failures. These gaps can impede accurate climate modeling, weather forecasting, and marine ecosystem analysis. Effectively managing missing data is vital for enhancing the reliability and usability of oceanic datasets.
This thesis explores the issue of missing data imputation in oceanographic time-series datasets, with a particular focus on sea temperature measurements. A comparative study of various imputation methodologies is presented, including deep learning-based methods (including Self-Attention-based Imputation for Time Series (SAITS), Bidirectional Generative Adversarial Networks (Bi-GAN), and PyPOTS-based approaches), and generative adversarial networks (GANs). The datasets utilized in this study are sourced from oceanographic monitoring platforms like EMODnet and the Copernicus Marine Service, which provide univariate and multivariate time-series data collected from various depths and locations.
A significant challenge in oceanographic data imputation is dealing with irregular time intervals, high missing rates, and dependencies among multiple variables. This research employs both synthetic and real-world missing data scenarios to assess the performance of different imputation techniques. The planned experimental evaluation will benchmark methods using key performance metrics such as Mean Absolute Error (MAE) and Root Mean Squared Error (RMSE), along with advanced measures like R-Squared (R²) to evaluate the statistical integrity of the imputed values.
The results of this research will contribute to ongoing efforts in oceanographic data analysis.
Type
info:eu-repo/semantics/masterThesisCollections
- Laurea Magistrale [5638]