STATISTICAL LEARNING

Pietro CORETTO STATISTICAL LEARNING

0212800017
DIPARTIMENTO DI SCIENZE ECONOMICHE E STATISTICHE
CORSO DI LAUREA
STATISTICA PER I BIG DATA
2023/2024

OBBLIGATORIO
ANNO CORSO 3
ANNO ORDINAMENTO 2018
PRIMO SEMESTRE
CFUOREATTIVITÀ
1060LEZIONE
Obiettivi
OBIETTIVI FORMATIVI
IL CORSO SI PONE L’OBIETTIVO DI INTRODURRE I PRINCIPALI STRUMENTI STATISTICI PER LA RIDUZIONE DELLA COMPLESSITÀ DI DATI MULTIVARIATI ATTRAVERSO TECNICHE DI RIDUZIONE DELLA DIMENSIONALITÀ, E METODI AGGREGANO IN MODO OTTIMALE SOTTOGRUPPI DELLA POPOLAZIONE OSSERVATA.

CONOSCENZA E CAPACITÀ DI COMPRENSIONE
IL CORSO INTENDE TRASFERIRE ALLO STUDENTE CONOSCENZE RELATIVE AI PRINCIPALI METODI DI RIDUZIONE DELLA DIMENSIONALITÀ IN GRANDI BASI DATI, LA CLASSIFICAZIONE, ED IL CLUSTERING. L’ASPETTO METODOLOGICO È ACCOMPAGNATO SEMPRE DA UNA GUIDA PRATICA AI PRINCIPALI SOFTWARE STATISTICI. TALI CONOSCENZE HANNO L’OBIETTIVO DI: (I) METTERE LO STUDENTE IN CONDIZIONI DI POTER DECIDERE ED APPLICARE IL METODO PIÙ OPPORTUNO IN FUNZIONE DEL CASO SPECIFICO; (II) SVILUPPARE IN AUTONOMIA UNA VALUTAZIONE CRITICA DEI RISULTATI OTTENUTI.

CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
LA CONOSCENZA ACQUISITA HA L’OBIETTIVO SVILUPPARE NELLO STUDENTE: (I) PADRONANZA E COMPRENSIONE DEL FUNZIONAMENTO DI STRUMENTI STATISTICI DESTINATI ALLA RIDUZIONE DELLA COMPLESSITÀ DELLE MODERNE BASI DATI; (II) CAPACITÀ DI UTILIZZARE IN AUTONOMIA TALI METODOLOGIE NEI MOLTEPLICI CONTESTI APPLICATIVI (ECONOMIA E SCIENZE SOCIALI, SCIENZE DELLA VITA, INDUSTRIA, RETI SOCIALI, ETC); (III) LA CAPACITÀ DI UTILIZZARE I PRINCIPALI SOFTWARE STATISTICI PER RISOLVERE CASI STUDIO REALI.
Prerequisiti
CONOSCENZE DI:
- PRINCIPALI STRUMENTI DI ANALISI MATEMATICA
- ALGEBRA DELLE MATRICI
- CALCOLO DELLE PROBABILITÀ
- ELEMENTI DI ANALISI STATISTICA DESCRITTIVA E VISUALIZZAZIONE DEI DATI
Contenuti
IL CORSO COMPRENDE I SEGUENTI ARGOMENTI
- APPRENDIMENTO STATISTICO E PREVISIONE
- CLASSIFICAZIONE ED OTTIMALITÀ RISPETTO ALLA 0-1 LOSS
- CLASSIFICATORE LOGISTICO
- GEOMETRIA DEI DATI MULTIVARIATI: DISTANZE, DISSIMILARITÀ, CORRELAZIONE E FORME ELLITTICO-SIMMETRICHE
- CLASSIFICATORE LDA, QDA E KNN
- ERRORE DI PREVISIONE E BIAS-VARIANCE TRADE-OFF
- CROSS-VALIDATION E STIMA DELL'ERRORE
- COMPRESSIONE E RIDUZIONE DEI DATI
- ANALISI DELLE COMPONENTI PRINCIPALI
- ALGORITMI DI CLUSTERING: K-MEANS, K-MEDOIDS E METODI GERARCHICI
- VALIDAZIONE E SELEZIONE DEL CLUSTERING OTTIMALE
Metodi Didattici
LEZIONI FRONTALI, ESERCITAZIONI ED ANALISI DI STUDI DI CASO
Verifica dell'apprendimento
L'ESAME PREVEDE LO SVOLGIMENTO DI UNA PROVA SCRITTA, IN LABORATORIO, E UNA ORALE. ENTRAMBE LE PROVE SONO VALUTATE SU UNA SCALA IN TRENTESIMI. PER ACCEDERE ALLA PROVA ORALE È NECESSARIO SUPERARE LA PROVA SCRITTA CON ALMENO 18/30. LA PROVA SCRITTA (DURATA CIRCA 2H). DURANTE LA PROVA SCRITTA LO STUDENTE RICEVERÀ UNA TRACCIA D’ESAME E SARÀ CHIAMATO A RISPONDERE A CIRCA 8 DOMANDE (DA 1 PUNTO FINO 7 PUNTI) SULL’INTERO PROGRAMMA DEL CORSO, UTILIZZANDO UN DATASET FORNITO IN SEDE DI ESAME. LA PROVA ORALE (DURATA CIRCA 15 MIN) E' TESA AD APPROFONDIRE IL LIVELLO DELLE CONOSCENZE, L'AUTONOMIA DI ANALISI E GIUDIZIO, NONCHE' LE CAPACITA' ESPOSITIVE DELLO STUDENTE. LA VALUTAZIONE DELLE PROVE TIENE CONTO DELLA EFFICACIA DEI METODI UTILIZZATI, DELLA COMPLETEZZA ED ESATTEZZA DELLE RISPOSTE, NONCHE' DELLA CHIAREZZA NELLA PRESENTAZIONE. IL VOTO FINALE, ESPRESSO IN TRENTESIMI CON EVENTUALE LODE, TIENE CONTO DELL'ESITO DELLE DUE PROVE.
Testi
NOTE DIDATTICHE E RIFERIMENTI BIBLIOGRAFICI DISPONIBILI ON-LINE FORNITI DAL DOCENTE DURANTE IL CORSO

JAMES, G., WITTEN, D., HASTIE, T., & TIBSHIRANI, R. (2013). AN INTRODUCTION TO STATISTICAL LEARNING (VOL. 112, PP. 3-7). NEW YORK: SPRINGER.
Altre Informazioni
INFORMAZIONI AGGIUNTIVE SARANNO DISPONIBILI ON-LINE SULLA PAGINA WEB DEL DOCENTE DEDICATA AL CORSO. LA FREQUENZA, PUR NON ESSENDO OBBLOGATORIA, È FORTEMENTE CONSIGLIATA.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-05]