STATISTICAL LEARNING

Pietro CORETTO STATISTICAL LEARNING

0212800017
DIPARTIMENTO DI SCIENZE ECONOMICHE E STATISTICHE
CORSO DI LAUREA
STATISTICA PER I BIG DATA
2020/2021

OBBLIGATORIO
ANNO CORSO 3
ANNO ORDINAMENTO 2018
PRIMO SEMESTRE
CFUOREATTIVITÀ
1060LEZIONE
Obiettivi
CONOSCENZE E CAPACITÀ DI COMPRENSIONE (KNOWLEDGE AND UNDERSTANDING)

IL CORSO SI PROPONE I METODI DI APPRENDIMENTO STATISTICO AUTOMATICO (MACHINE LEARNING) CON PARTICOLARE ENFASI SULLE APPLICAZIONI PER I GRANDI DATA SETS MODERNI (BIG DATA). ALLA FINE DEL CORSO LO STUDENTE SARÀ IN GRADO DI SVILUPPARE PROCEDURE AUTOMATIZZATE PER ESTRARRE PATTERNS E TRENDS, E FORMULARE PREVISIONI ACCURATE SULLA BASE DI DATABASE COMPLESSI AD ELEVATA DIMENSIONALITÀ. IN PARTICOLARE CI SI ATTENDE CHE GLI STUDENTI ACQUISISCANO LE SEGUENTI CONOSCENZE E CAPACITÀ:
- CONOSCENZA DEI MODERNI ALGORITMI DI APPRENDIMENTO SUPERIVISIONATO
- CONOSCENZA DEI MODERNI ALGORITMI DI APPRENDIMENTO NON SUPERVISIONATO
- CONOSCENZA DELLE PRINCIPALI LIBRERIE SOFTWARE PER L'APPRENDIMENTO STATISTICO
- CAPACITÀ DI VALIDARE ED INTERPRETARE LE SOLUZIONI DI UN ALGORITMO IN FUNZIONE
DEL PROBLEMA SPECIFICO.


CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE

SULLA BASE DELLE CONOSCENZE ACQUISITE LO STUDENTE SARÀ IN GRADO DI:
- COMPRENDERE GLI ASPETTI TECNICI SOTTOSTANTI I PRINCIPALI METODI ED ALGORITMI
PER L'APPRENDIMENTO STATISTICO;
- APPLICARE IN AUTONOMIA GLI STRUMENTI INTRODOTTI AL CORSO;
- CAPACITÀ DI SELEZIONARE IN AUTONOMIA LO STRUMENTO PIÙ APPROPRIATO IN FUNZIONE DEL
PROBLEMA SPECIFICO DA RISOLVERE;
- CAPACITÀ DI UTILIZZARE I PRINCIPALI STRUMENTI COMPUTAZIONALI PER LA SOLUZIONE
DI PROBLEMI DI RILEVANZA PRATICA NEL CONTESTO DEI BIG DATA
Prerequisiti
CONOSCENZE DI:
- PRINCIPALI STRUMENTI DI ANALISI MATEMATICA
- ALGEBRA DELLE MATRICI
- CALCOLO DELLE PROBABILITÀ
- ELEMENTI DI ANALISI STATISTICA DESCRITTIVA E VISUALIZZAZIONE DEI DATI
Contenuti
IL CORSO COMPRENDE I SEGUENTI ARGOMENTI
- APPRENDIMENTO STATISTICO E PREVISIONE
- ERRORE DI PREVISIONE E BIAS-VARIANCE TRADE-OFF
- GEOMETRIA DEI DATI MULTIVARIATI: METRICHE LP, DISSIMILARITÀ, FORME ELLITTICO-SIMMETRICHE E CORRELAZIONE.
- APPRENDIMENTO SUPERVISIONATO E CLASSIFICAZIONE
- ALGORITMI DI CLASSIFICAZIONE: LDA, QDA, KNN, LOGISTIC REGRESSION
- STIMA DELLE COMPONENTI DEL MISCLASSIFICATION ERROR
- METODI DI RESAMPLING: CROSS-VALIDATION E BOOTSTRAP
- APPRENDIMENTO NON SUPERVISIONATO
- DATA REDUCTION: PCA, ICA, MDS
- ALGORITMI DI CLUSTERING: K-MEANS, K-MEDOIDS, METODI GERARCHICI, MODEL-BASED
- IL PROBLEMA DEL NUMERO DI GRUPPI E VALIDAZIONE DELLA SOLUZIONE DI CLUSTERING
- CENNI SU ALTRI METODI DI APPRENDIMENTO AVANZATI: SVM, CLASSIFICATION TREES E RANDOM FOREST, BAGGING, BOOSTING, DENSITY-BASED CLUSTERING, HIGH-DIMENSIONAL LDA E QDA.
Metodi Didattici
LEZIONI FRONTALI, ESERCITAZIONI ED ANALISI DI STUDI DI CASO
Verifica dell'apprendimento
L'ESAME PREVEDE LO SVOLGIMENTO DI UNA PROVA SCRITTA, IN LABORATORIO, E UNA ORALE. ENTRAMBE LE PROVE SONO VALUTATE SU UNA SCALA IN TRENTESIMI. PER ACCEDERE ALLA PROVA ORALE È NECESSARIO SUPERARE LA PROVA SCRITTA CON ALMENO 18/30.

LA PROVA SCRITTA (DURATA CIRCA 1.5 H). DURANTE LA PROVA SCRITTA LO STUDENTE RICEVERÀ UNA TRACCIA D’ESAME E SARÀ CHIAMATO A RISPONDERE A 10 DOMANDE (DA 1 PUNTO FINO 3 PUNTI) SULL’INTERO PROGRAMMA DEL CORSO, UTILIZZANDO UN DATASET FORNITO IN SEDE DI ESAME.
LA PROVA ORALE (DURATA CIRCA 15 MIN) E' TESA AD APPROFONDIRE IL LIVELLO DELLE CONOSCENZE, L'AUTONOMIA DI ANALISI E GIUDIZIO, NONCHE' LE CAPACITA' ESPOSITIVE DELLO STUDENTE.
LA VALUTAZIONE DELLE PROVE TIENE CONTO DELLA EFFICACIA DEI METODI UTILIZZATI, DELLA COMPLETEZZA ED ESATTEZZA DELLE RISPOSTE, NONCHE' DELLA CHIAREZZA NELLA PRESENTAZIONE.
IL VOTO FINALE, ESPRESSO IN TRENTESIMI CON EVENTUALE LODE, TIENE CONTO DELL'ESITO DELLE DUE PROVE.
Testi
NOTE DIDATTICHE E RIFERIMENTI BIBLIOGRAFICI DISPONIBILI ON-LINE FORNITI DAL DOCENTE DURANTE IL CORSO

JAMES, G., WITTEN, D., HASTIE, T., & TIBSHIRANI, R. (2013). AN INTRODUCTION TO STATISTICAL LEARNING (VOL. 112, PP. 3-7). NEW YORK: SPRINGER.
Altre Informazioni
INFORMAZIONI AGGIUNTIVE SARANNO DISPONIBILI ON-LINE SULLA PAGINA WEB DEL DOCENTE DEDICATA AL CORSO. LA FREQUENZA, PUR NON ESSENDO OBBLOGATORIA, È FORTEMENTE CONSIGLIATA.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2022-05-23]