STATISTICAL LEARNING

Pietro CORETTO STATISTICAL LEARNING

0212800017
DIPARTIMENTO DI SCIENZE ECONOMICHE E STATISTICHE
CORSO DI LAUREA
STATISTICA PER I BIG DATA
2024/2025

OBBLIGATORIO
ANNO CORSO 3
ANNO ORDINAMENTO 2018
PRIMO SEMESTRE
CFUOREATTIVITÀ
1060LEZIONE
AppelloData
CORETTO16/12/2024 - 09:30
CORETTO16/12/2024 - 09:30
Obiettivi
CONOSCENZE E CAPACITÀ DI COMPRENSIONE
IL CORSO SI PROPONE I METODI DI APPRENDIMENTO STATISTICO AUTOMATICO (MACHINE LEARNING) CON PARTICOLARE ENFASI SULLE APPLICAZIONI PER I GRANDI DATA SETS MODERNI (BIG DATA). ALLA FINE DEL CORSO LO STUDENTE SARÀ IN GRADO DI SVILUPPARE PROCEDURE AUTOMATIZZATE PER ESTRARRE PATTERNS E TRENDS, E FORMULARE PREVISIONI ACCURATE SULLA BASE DI DATABASE COMPLESSI AD ELEVATA DIMENSIONALITÀ. IN PARTICOLARE CI SI ATTENDE CHE GLI STUDENTI ACQUISISCANO LE SEGUENTI CONOSCENZE E CAPACITÀ:

- CONOSCENZA DEI MODERNI ALGORITMI DI APPRENDIMENTO SUPERVISIONATO
- CONOSCENZA DEI MODERNI ALGORITMI DI APPRENDIMENTO NON SUPERVISIONATO
- CONOSCENZA DELLE PRINCIPALI LIBRERIE SOFTWARE PER L'APPRENDIMENTO STATISTICO
- CAPACITÀ DI VALIDARE ED INTERPRETARE LE SOLUZIONI DI UN ALGORITMO IN FUNZIONE DEL PROBLEMA SPECIFICO.


CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE

SULLA BASE DELLE CONOSCENZE ACQUISITE LO STUDENTE SARÀ IN GRADO DI:
- COMPRENDERE GLI ASPETTI TECNICI SOTTOSTANTI I PRINCIPALI METODI ED ALGORITMI PER L'APPRENDIMENTO STATISTICO;
- APPLICARE IN AUTONOMIA GLI STRUMENTI INTRODOTTI AL CORSO;
- CAPACITÀ DI SELEZIONARE IN AUTONOMIA LO STRUMENTO PIÙ APPROPRIATO IN FUNZIONE DEL PROBLEMA SPECIFICO DA RISOLVERE;
- CAPACITÀ DI UTILIZZARE I PRINCIPALI STRUMENTI COMPUTAZIONALI PER LA SOLUZIONE DI PROBLEMI DI RILEVANZA PRATICA NEL CONTESTO DEI BIG DATA
Prerequisiti
CONOSCENZE DI:
- PRINCIPALI STRUMENTI DI ANALISI MATEMATICA
- ALGEBRA DELLE MATRICI
- CALCOLO DELLE PROBABILITÀ
- ELEMENTI DI ANALISI STATISTICA DESCRITTIVA E VISUALIZZAZIONE DEI DATI
Contenuti
IL CORSO COMPRENDE I SEGUENTI ARGOMENTI
- APPRENDIMENTO STATISTICO E PREVISIONE
- CLASSIFICAZIONE ED OTTIMALITÀ RISPETTO ALLA 0-1 LOSS
- CLASSIFICATORE LOGISTICO
- GEOMETRIA DEI DATI MULTIVARIATI: DISTANZE, DISSIMILARITÀ, CORRELAZIONE E FORME ELLITTICO-SIMMETRICHE
- CLASSIFICATORE LDA, QDA E KNN
- ERRORE DI PREVISIONE E BIAS-VARIANCE TRADE-OFF
- CROSS-VALIDATION E STIMA DELL'ERRORE
- COMPRESSIONE E RIDUZIONE DEI DATI
- ANALISI DELLE COMPONENTI PRINCIPALI
- ALGORITMI DI CLUSTERING: K-MEANS, K-MEDOIDS E METODI GERARCHICI
- VALIDAZIONE E SELEZIONE DEL CLUSTERING OTTIMALE
Metodi Didattici
LEZIONI FRONTALI, ESERCITAZIONI ED ANALISI DI STUDI DI CASO
Verifica dell'apprendimento
L'ESAME PREVEDE LO SVOLGIMENTO DI UNA PROVA SCRITTA, IN LABORATORIO, E UNA ORALE. ENTRAMBE LE PROVE SONO VALUTATE SU UNA SCALA IN TRENTESIMI. PER ACCEDERE ALLA PROVA ORALE È NECESSARIO SUPERARE LA PROVA SCRITTA CON ALMENO 18/30. LA PROVA SCRITTA (DURATA CIRCA 2H). DURANTE LA PROVA SCRITTA LO STUDENTE RICEVERÀ UNA TRACCIA D’ESAME E SARÀ CHIAMATO A RISPONDERE A CIRCA 8 DOMANDE (DA 1 PUNTO FINO 7 PUNTI) SULL’INTERO PROGRAMMA DEL CORSO, UTILIZZANDO UN DATASET FORNITO IN SEDE DI ESAME. LA PROVA ORALE (DURATA CIRCA 15 MIN) E' TESA AD APPROFONDIRE IL LIVELLO DELLE CONOSCENZE, L'AUTONOMIA DI ANALISI E GIUDIZIO, NONCHE' LE CAPACITA' ESPOSITIVE DELLO STUDENTE. LA VALUTAZIONE DELLE PROVE TIENE CONTO DELLA EFFICACIA DEI METODI UTILIZZATI, DELLA COMPLETEZZA ED ESATTEZZA DELLE RISPOSTE, NONCHE' DELLA CHIAREZZA NELLA PRESENTAZIONE. IL VOTO FINALE, ESPRESSO IN TRENTESIMI CON EVENTUALE LODE, TIENE CONTO DELL'ESITO DELLE DUE PROVE.
Testi
NOTE DIDATTICHE E RIFERIMENTI BIBLIOGRAFICI DISPONIBILI ON-LINE FORNITI DAL DOCENTE DURANTE IL CORSO

JAMES, G., WITTEN, D., HASTIE, T., & TIBSHIRANI, R. (2013). AN INTRODUCTION TO STATISTICAL LEARNING (VOL. 112, PP. 3-7). NEW YORK: SPRINGER.
Altre Informazioni
INFORMAZIONI AGGIUNTIVE SARANNO DISPONIBILI ON-LINE SULLA PAGINA WEB DEL DOCENTE DEDICATA AL CORSO. LA FREQUENZA, PUR NON ESSENDO OBBLOGATORIA, È FORTEMENTE CONSIGLIATA.
Orari Lezioni

  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-18]