MACHINE LEARNING AND BIG DATA ANALYTICS

Mario VENTO MACHINE LEARNING AND BIG DATA ANALYTICS

0622700052
DIPARTIMENTO DI INGEGNERIA DELL'INFORMAZIONE ED ELETTRICA E MATEMATICA APPLICATA
CORSO DI LAUREA MAGISTRALE
INGEGNERIA INFORMATICA
2017/2018



ANNO CORSO 2
ANNO ORDINAMENTO 2016
SECONDO SEMESTRE
CFUOREATTIVITÀ
324LEZIONE
324LABORATORIO
Obiettivi
L’insegnamento mira a fornire le conoscenze teoriche, metodologiche e tecnologiche per l’apprendimento automatico e per l’analisi di grandi quantita di dati, includendo tecniche tradizionali e paradigmi innovativi come il Deep Learning.

Conoscenze e capacita di comprensione
I principali paradigmi di apprendimento strutturato, statistico e neurale. Apprendimento non supervisionato. Deep learning. Paradigmi e strumenti per l’analisi di grandi quantita di dati.

Conoscenze e capacita di comprensione applicate
Al termine dell’insegnamento gli studenti saranno in grado di progettare e realizzare soluzioni per problemi di apprendimento automatico e analisi di grandi quantita di dati integrando nella maniera piu efficace strumenti esistenti e configurandone in maniera ottimale i parametri di funzionamento.
Prerequisiti
-
Contenuti
Introduzione alla Pattern Recognition e al Machine Learning. Schema generale di un sistema di analisi dei dati (2 ore).

Rappresentazione dei dati vettoriale e strutturale (2 ore).

Apprendimento induttivo concettuale in domini strutturati. Alberi di decisione, apprendimento di regole. Gli algoritmi AQ e ID3 (4 ore)

Apprendimento statistico. Fondamenti teorici. Formulazione bayesiana del problema. Errore di bias ed errore di varianza. La maledizione della dimensionalità. Il classificatore Nearest Neighbor (4 ore).

Feature reduction. Feature selection con algoritmi greedy (forward selection, backward elimination). Riduzione delle feature mediante Principal Component Analysis (PCA) (4 ore).

Linear Discriminant Analysis (LDA). Tecniche di regolarizzazione (ridge regression, lasso). Support Vector Machines (SVM). Il kernel trick e l’estensione delle tecniche lineari a problemi non linearmente separabili (6 ore).

Apprendimento non supervisionato. Clustering. Gli algoritmi k-Means e Single-Linkage Clustering. (2 ore)

Apprendimento con reti neurali artificiali. Il percettrone. Le reti Multi-Layer Perceptron (MLP). (4 ore).
Clustering con reti neurali. Reti Self-Organizing Map (SOM) e Learning Vector Quantization. (LVQ) (2 ore)
Deep learning con reti neurali. Principi fondamentali. Le reti Restricted Boltzmann Machine (RBM). (3 ore)
Apprendimento di dati multimediali (immagini, audio). Le reti Convolutional Neural Network (CNN). (5 ore)

Tecnologie per l’analisi di Big Data. Il paradigma Map Reduce (2 ore).
Il framework Apache Hadoop. Memorizzazione di dati su file system distribuito (4 ore)
Implementazione di Map-Reduce in Hadoop. Il Mapper. Le operazioni di Shuffle e Reduce. Streaming. (4 ore).
Metodi Didattici
L’INSEGNAMENTO CONTEMPLA LEZIONI TEORICHE, ESERCITAZIONI IN AULA ED ESERCITAZIONI PRATICHE DI LABORATORIO.
Verifica dell'apprendimento
Il raggiungimento degli obiettivi dell’insegnamento e certificato mediante il superamento di un esame con valutazione in trentesimi. L'esame prevede la discussione di un progetto realizzato in gruppo (con gruppi di 3-4 persone) e un colloquio orale individuale.
La discussione del progetto è volta a dimostrare la capacità di applicare le conoscenze e la capacità di comprensione mediante la realizzazione una semplice applicazione degli strumenti di machine learning o big data analytics presentati nel corso a un problema proposto dal docente. La discussione del progetto prevede una dimostrazione pratica del funzionamento dell'applicazione realizzata, la presentazione della valutazione delle prestazioni dell'applicazione mediante indicatori quantitativi, e una descrizione delle scelte tecniche effettuate, eventualmente con l'ausilio di slide.
Il colloquio orale mira a verificare il livello delle conoscenze e della capacità di comprensione degli argomenti affrontati nel corso, nonché la capacità di esposizione dello studente.
Testi
Da definire
Altre Informazioni
L'insegnamento è tenuto in lingua inglese.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2019-05-14]