Corso
Inizio 6 aprile 2021
Docente: Giuseppe Andrea Trunfio, DADU, Università degli Studi di Sassari
Corso
Docente: prof. Giuseppe Andrea Trunfio, DADU, Università degli Studi di Sassari
Durata: 20 ore
Data d’inizio: 6 aprile 2021, ore 15-17.
Le lezioni si terranno con cadenza settimanale, di norma di martedì dalle 15:00 alle 17:00, con possibilità di concordare variazioni a seconda delle esigenze.
Sunto del corso
Il machine learning include una varietà di tecniche che consentono ai computer di automatizzare la costruzione di modelli dai dati, con un intervento umano ridotto al minimo. Si tratta di un campo che si è rapidamente sviluppato negli ultimi anni grazie alla crescita della disponibilità di dati accessibili ai computer, all’aumentata potenza di elaborazione e capacità di memorizzazione, nonché ai continui progressi nel campo degli algoritmi. In questo corso, verranno introdotti i più importanti concetti e algoritmi alla base del machine learning, illustrandone i limiti e le potenzialità, con particolare riferimento ad applicazioni di interesse per l’ingegneria civile e ambientale, l’architettura e l’analisi territoriale.
È consigliata una conoscenza operativa d’uso del software R.
Descrizione
Il machine learning include una varietà di tecniche che consentono ai computer di automatizzare la costruzione di modelli dai dati, con un intervento umano ridotto al minimo. Si tratta di un campo che si è rapidamente sviluppato negli ultimi anni grazie alla crescita della disponibilità di dati accessibili ai computer, all’aumentata potenza di elaborazione e capacità di memorizzazione, nonché ai continui progressi nel campo degli algoritmi. I recenti successi nelle applicazioni del machine learning hanno poi favorito la tendenza a raccogliere ancora più dati, per elaborare i quali vengono rese disponibili sempre maggiori potenze di calcolo. Il machine learning ci ha recentemente portato anche alle auto a guida automatica, a straordinari miglioramenti nella visione artificiale, ad avanzati strumenti basati sul riconoscimento vocale e della scrittura. Le applicazioni riguardano innumerevoli altri campi, e includono un notevole miglioramento della conoscenza del genoma umano, la scoperta di sequenze genetiche legate ad alcune malattie, l’identificazione di aree urbane in cui è più probabile l’attività criminale, l’identificazione automatica delle transazioni fraudolente con carta di credito, l’ottimizzazione del consumo di energia nelle case e negli uffici, le applicazioni della domotica, oltre alla segmentazione dei potenziali clienti per inviare loro pubblicità mirata. Una tendenza di ricerca particolarmente interessante è poi quella del machine learning a supporto della modellistica, ad esempio nel campo dell’ingegneria, che vede la realizzazione di diversi tipi di sinergie tra approcci tipicamente di data science e tradizionali approcci modellistici basati sulla teoria. Si può affermare che virtualmente in ogni campo scientifico è ormai possibile ipotizzare potenziali avanzamenti basati sulle tecniche di machine learning. In questo corso, verranno introdotti i più importanti concetti e algoritmi alla base del machine learning, illustrandone i limiti e le potenzialità, con particolare riferimento ad applicazioni di interesse per l’ingegneria civile e ambientale, l’architettura e l’analisi territoriale. Le lezioni sono rivolte a laureati in possesso delle basi matematiche e competenze informatiche tipiche dei laureati in ingegneria ed architettura. Durante le attività si userà il noto ambiente R per il calcolo statistico al fine di sperimentare le tecniche oggetto di studio.
È consigliata una conoscenza operativa d’uso del software R.
Agromenti
- Apprendimento automatico: reperimento e conservazione dei dati; astrazione, rappresentazione della conoscenza e modelli; generalizzazione e creazione di conoscenza; valutazione del processo di apprendimento, bias e overfitting. Machine learning in pratica: fasi del processo di apprendimento automatico; tipi di dati, unità di osservazione, istanze e features; obiettivi dell’apprendimento e tipi di algoritmi. Introduzione a R: elementi di sintassi, strutture di dati (vettori, fattori, liste, data frames, matrici ed array); gestione dei dati; uso di librerie. Elementi di analisi esplorativa dei dati. Data cleaning (valori mancanti, dati duplicati, errori e outliers)
- Lazy learners, classificatore k-nearest neighbours; calcolo delle distanze; normalizzazione dei dati; classificatori Bayesiani; alberi di decisione, regole di classificazione e relativi algoritmi. Preparazione di train e test set in R. Applicazioni in R (preparazione dei dati; training; valutazione e miglioramento dei modelli).
- Cenno sui metodi basati su kernel e classificazione basata su Support Vector Machines. Regressione lineare semplice e multipla; regressione logistica; alberi di regressione e relativi algoritmi; esempi di applicazioni in R (preparazione dei dati; training; valutazione e miglioramento dei modelli)
- Reti neurali artificiali e deep learning: Single Layer Perceptron Model; Multilayer Perceptron Model; Convolutional Neural Networks; Autoencoders. Esempi di applicazioni in R.
- Recurrent Neural Networks e Long Short-Term Memory. Modellazione di serie temporali. Esempi di applicazioni in R.
Lezione aperta conclusiva
Il corso si concluderà con una lezione aperta, rivolta anche al pubblico che non ha frequentato il corso, e presenterà i più interessanti e recenti sviluppi del machine learning, con particolare riferimento al deep learning. Preliminarmente, una introduzione generale fornirà un inquadramento storico e alcuni elementi di base sulle metodologie di maggior successo. Quindi, saranno illustrate alcune direzioni di ricerca che appaiono rilevanti per le potenziali applicazioni nel campo l’ingegneria civile e ambientale, l’architettura e l’analisi territoriale. Nel corso della discussione, saranno evidenziate le potenzialità e le limitazioni delle attuali tecniche di machine learning.
Contatti
Giuseppe Andrea Trunfio – trunfio@uniss.it
Modalità di iscrizione
Per iscriversi compilare il modulo di iscrizione.
Materiali messi a disposizione
- Diapositive del corso
- Codice R e dataset di esempio
Bibliografia e riferimenti Web
- Ethem Alpaydin, Machine Learning: The New AI. The MIT Press Essential Knowledge Series. 2016
- Shai Shalev-Shwartz, Shai Ben-David, Understanding Machine Learning – From Theory to Algorithms, Oxford University Press, 2014
- Terrence J. Sejnowski, The Deep Learning Revolution, The MIT Press, London, 2018
- Ian Goodfellow, Yoshua Bengio, Aaron Courville, Deep Learning, The MIT Press, London, 2016 (https://www.deeplearningbook.org/)
- Jon Krohn, Beyleveld Grant, Bassens Aglaé, Deep Learning Illustrated: A Visual, Interactive Guide to Artificial Intelligence, First Editon, AddisonWesley Professional, 2019 (https://www.deeplearningillustrated.com/)
- Aston Zhang, Zachary C. Lipton, Mu Li, and Alexander J. Smola, Dive into Deep Learning, (https://d2l.ai/)
- Brett Lantz, Machine Learning with R – Third Edition, Packt Publishing. 2019
- François Chollet, J. J. Allaire, Deep Learning with R, Manning, 2018
- Yuxi (Hayden) Liu,Pablo Maldonado, R Deep Learning Projects, Packt Publishing, 2018
- Cathy O’neil, Armi di Distruzione Matematica – Come i Big data, aumentano la disuguaglianza e minacciano la democrazia, Bompiani, 2017
- Ed Finn, Che cosa vogliono gli algoritmi? L’immaginazione nell’era dei computer, Einaudi, 2018
- Dominique Cardon, Che cosa sognano gli algoritmi. Le nostre vite al tempo dei big data, Mondadori, 2016
- Domenico Talia, La società calcolabile e i big data. Algoritmi e persone nel mondo digitale Rubettino, 2018
- Domenico Talia, Big Data And The Computable Society: Algorithms And People In The Digital World, World Scientific, 2019
- Judea Pearl, Dana Mackenzie, The Book of Why: The New Science of Cause and Effect, 2019