Distinta di base di un’AI: verso una descrizione completa dei modelli di machine learning
Mostra/ Apri
Autore
Luperini, Davide <2002>
Data
2024-07-18Disponibile dal
2024-07-25Abstract
Una "distinta di base", “Bill of Materials” in inglese (BoM), rappresenta l'elenco delle materie prime e delle procedure necessarie nelle catene di montaggio per realizzare un particolare prodotto. Seguendo questo documento è possibile replicare perfettamente l'oggetto descritto in tutte le sue componenti e funzionalità. Allo stesso modo, questo concetto è già stato portato nel dominio dei programmi per computer sotto il nome di “Software Bill of Materials” (SBoM), fornendo gli elementi fondamentali per lo sviluppo di codice sicuro e replicabile. Tuttavia, con l’avvento delle tecnologie di apprendimento automatico si sta attualmente assistendo a una massiccia integrazione tra componenti di intelligenza artificiale e software, ma manca ancora una documentazione trasparente che consenta la perfetta replica di queste tecnologie, poiché per loro non esiste ancora una “distinta di base”.
Inoltre, il 13 marzo 2024 il Parlamento europeo ha emanato l’“EU AI ACT”, che richiede la certificazione dei modelli di machine learning utilizzati in ambienti ad alto rischio, insieme ad una documentazione condivisibile delle parti interne di tale prodotto.
Pertanto, in questo lavoro di tesi viene svolto uno studio riguardante la struttura sia di un BoM che di un SBoM, per capire quale potrebbe essere una proposta iniziale per un “AI Bill of Materials” (AIBoM), che descriverà tutti gli aspetti tecnici dei modelli di machine learning, dalla raccolta dei dati alla distribuzione.
All’interno della tesi sarà rivista la definizione e lo sviluppo sia di un BoM che di un SBoM, con particolare attenzione alla comprensione del loro formato e a come potrebbero essere utili per descrivere i modelli di machine learning. Verrà poi analizzato nel dettaglio la struttura di un’AIBoM e dei suoi componenti proposti.
Infine, sarà presentato un possibile programma Python che, dato un modello e la sua pipeline di addestramento, produca un AIBoM con le informazioni dettagliate dall'AIBoM concettualizzato, di A "Bill of Materials" (BoM) is a list of raw materials and procedures necessary in assembly lines to produce a particular product. By following this document, it is possible to perfectly replicate the described item in all its components and functionalities. Similarly, this concept has already been brought into the domain of computer programs under the name "Software Bill of Materials" (SBoM), providing the fundamental elements for the development of secure and replicable code. However, with the advent of machine learning technologies, there is currently a massive integration between artificial intelligence components and software, but there is still a lack of transparent documentation that allows the perfect replication of these technologies, as a "Bill of Materials" does not yet exist for them.
Moreover, on 13 March 2024 the European Parliament has issued the "EU AI ACT," which requires the certification of machine learning models used in high-risk environments, along with shareable documentation of the internal parts of such products.
Therefore, in this thesis, a study is conducted on the structure of both a BoM and an SBoM to understand what could be an initial proposal for an "AI Bill of Materials" (AIBoM), which will describe all the technical aspects of machine learning models, from data collection to distribution.
Within the thesis, the definition and development of both a BoM and an SBoM will be reviewed, with particular attention to understanding their format and how they might be useful for describing machine learning models. Then, the structure of an AIBoM and its proposed components will be analyzed in detail.
Finally, a possible Python program will be presented that, given a model and its training pipeline, produces an AIBoM with detailed information from the conceptualized AIBoM, of which an example applied to a particular artificial intelligence case will be available.
Tipo
info:eu-repo/semantics/bachelorThesisCollezioni
- Laurea Triennale [2383]