MACHINE LEARNING AND BIG DATA ANALYTICS

Pasquale FOGGIA MACHINE LEARNING AND BIG DATA ANALYTICS

0622900010
DIPARTIMENTO DI INGEGNERIA DELL'INFORMAZIONE ED ELETTRICA E MATEMATICA APPLICATA
CORSO DI LAUREA MAGISTRALE
DIGITAL HEALTH AND BIOINFORMATIC ENGINEERING
2019/2020

ANNO CORSO 2
ANNO ORDINAMENTO 2018
PRIMO SEMESTRE
CFUOREATTIVITÀ
324LEZIONE
324LABORATORIO
Obiettivi
L’INSEGNAMENTO MIRA A FORNIRE LE CONOSCENZE TEORICHE, METODOLOGICHE E TECNOLOGICHE PER L’APPRENDIMENTO AUTOMATICO E PER L’ANALISI DI GRANDI QUANTITA DI DATI, INCLUDENDO TECNICHE TRADIZIONALI E PARADIGMI INNOVATIVI COME IL DEEP LEARNING.

CONOSCENZE E CAPACITA DI COMPRENSIONE
I PRINCIPALI PARADIGMI DI APPRENDIMENTO STRUTTURATO, STATISTICO E NEURALE. APPRENDIMENTO NON SUPERVISIONATO. DEEP LEARNING. PARADIGMI E STRUMENTI PER L’ANALISI DI GRANDI QUANTITA DI DATI.

CONOSCENZE E CAPACITA DI COMPRENSIONE APPLICATE
AL TERMINE DELL’INSEGNAMENTO GLI STUDENTI SARANNO IN GRADO DI PROGETTARE E REALIZZARE SOLUZIONI PER PROBLEMI DI APPRENDIMENTO AUTOMATICO E ANALISI DI GRANDI QUANTITA DI DATI INTEGRANDO NELLA MANIERA PIU EFFICACE STRUMENTI ESISTENTI E CONFIGURANDONE IN MANIERA OTTIMALE I PARAMETRI DI FUNZIONAMENTO.
Prerequisiti
L'INSEGNAMENTO RICHIEDE LA CONOSCENZA DI BASE DEL LINGUAGGIO PYTHON.
Contenuti
Introduzione al machine learning. Schema generale di un sistema di apprendimento.
Errore di bias ed errore di varianza. Overfitting. La maledizione della dimensionalità. (4 ore)

Cenni ai classificatori Bayesiani e NN. (4 ore)

Classificatori lineari: Support Vector Machines (SVM). Il kernel trick e l’estensione delle tecniche lineari a problemi non linearmente separabili. Tecniche di regressione lineare. Tecniche di regolarizzazione (ridge regression, LASSO). La regressione logistica. (8 ore)

Cenni agli algoritmi di clustering. (4 ore)

Cenni ai sistemi multiclassificatore. I classificatori Random Forest. (8 ore)

Reinforcement learning. Concetti generali. L’algoritmo di Q-learning. Esempi. (4 ore)

Introduzione agli Hidden Markov Models. (8 ore)

Apprendimento con reti neurali artificiali. Il percettrone. Le reti multi-layer perceptron (MLP). (8 ore)

Clustering con reti neurali. Learning vector quantization (LVQ). Il problema del manifold learning e le reti SOM. (6 ore)

Deep learning con reti neurali. Principi fondamentali.
Le reti convolutional neural network (CNN). (8 ore)

Reti ricorrenti. LSTM e GRU. (4 ore)

Cenni alle architetture Deep-Learning avanzate. Autoencoders. Architetture per effettuare simultaneamente detection e recognition (es. YOLO). Generative-Adversarial Networks (GAN). (6 ore)
Metodi Didattici
L’INSEGNAMENTO CONTEMPLA LEZIONI TEORICHE, ESERCITAZIONI IN AULA ED ESERCITAZIONI PRATICHE DI LABORATORIO.
Verifica dell'apprendimento
IL RAGGIUNGIMENTO DEGLI OBIETTIVI DELL’INSEGNAMENTO E CERTIFICATO MEDIANTE IL SUPERAMENTO DI UN ESAME CON VALUTAZIONE IN TRENTESIMI. L'ESAME PREVEDE LA DISCUSSIONE DI UN PROGETTO REALIZZATO IN GRUPPO (CON GRUPPI DI 3-4 PERSONE) E UN COLLOQUIO ORALE INDIVIDUALE.
LA DISCUSSIONE DEL PROGETTO È VOLTA A DIMOSTRARE LA CAPACITÀ DI APPLICARE LE CONOSCENZE E LA CAPACITÀ DI COMPRENSIONE MEDIANTE LA REALIZZAZIONE UNA SEMPLICE APPLICAZIONE DEGLI STRUMENTI DI MACHINE LEARNING O BIG DATA ANALYTICS PRESENTATI NEL CORSO A UN PROBLEMA PROPOSTO DAL DOCENTE. LA DISCUSSIONE DEL PROGETTO PREVEDE UNA DIMOSTRAZIONE PRATICA DEL FUNZIONAMENTO DELL'APPLICAZIONE REALIZZATA, LA PRESENTAZIONE DELLA VALUTAZIONE DELLE PRESTAZIONI DELL'APPLICAZIONE MEDIANTE INDICATORI QUANTITATIVI, E UNA DESCRIZIONE DELLE SCELTE TECNICHE EFFETTUATE, EVENTUALMENTE CON L'AUSILIO DI SLIDE.
IL COLLOQUIO ORALE MIRA A VERIFICARE IL LIVELLO DELLE CONOSCENZE E DELLA CAPACITÀ DI COMPRENSIONE DEGLI ARGOMENTI AFFRONTATI NEL CORSO, NONCHÉ LA CAPACITÀ DI ESPOSIZIONE DELLO STUDENTE.
Testi
Dispense e altro materiale fornito durante il corso
Altre Informazioni
L'INSEGNAMENTO È TENUTO IN LINGUA INGLESE.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2021-02-19]