Pietro CORETTO | STATISTICAL LEARNING
Pietro CORETTO STATISTICAL LEARNING
cod. 0212800017
STATISTICAL LEARNING
0212800017 | |
DIPARTIMENTO DI SCIENZE ECONOMICHE E STATISTICHE | |
CORSO DI LAUREA | |
STATISTICA PER I BIG DATA | |
2020/2021 |
OBBLIGATORIO | |
ANNO CORSO 3 | |
ANNO ORDINAMENTO 2018 | |
PRIMO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | |
---|---|---|---|---|
SECS-S/01 | 10 | 60 | LEZIONE |
Obiettivi | |
---|---|
CONOSCENZE E CAPACITÀ DI COMPRENSIONE (KNOWLEDGE AND UNDERSTANDING) IL CORSO SI PROPONE I METODI DI APPRENDIMENTO STATISTICO AUTOMATICO (MACHINE LEARNING) CON PARTICOLARE ENFASI SULLE APPLICAZIONI PER I GRANDI DATA SETS MODERNI (BIG DATA). ALLA FINE DEL CORSO LO STUDENTE SARÀ IN GRADO DI SVILUPPARE PROCEDURE AUTOMATIZZATE PER ESTRARRE PATTERNS E TRENDS, E FORMULARE PREVISIONI ACCURATE SULLA BASE DI DATABASE COMPLESSI AD ELEVATA DIMENSIONALITÀ. IN PARTICOLARE CI SI ATTENDE CHE GLI STUDENTI ACQUISISCANO LE SEGUENTI CONOSCENZE E CAPACITÀ: - CONOSCENZA DEI MODERNI ALGORITMI DI APPRENDIMENTO SUPERIVISIONATO - CONOSCENZA DEI MODERNI ALGORITMI DI APPRENDIMENTO NON SUPERVISIONATO - CONOSCENZA DELLE PRINCIPALI LIBRERIE SOFTWARE PER L'APPRENDIMENTO STATISTICO - CAPACITÀ DI VALIDARE ED INTERPRETARE LE SOLUZIONI DI UN ALGORITMO IN FUNZIONE DEL PROBLEMA SPECIFICO. CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE SULLA BASE DELLE CONOSCENZE ACQUISITE LO STUDENTE SARÀ IN GRADO DI: - COMPRENDERE GLI ASPETTI TECNICI SOTTOSTANTI I PRINCIPALI METODI ED ALGORITMI PER L'APPRENDIMENTO STATISTICO; - APPLICARE IN AUTONOMIA GLI STRUMENTI INTRODOTTI AL CORSO; - CAPACITÀ DI SELEZIONARE IN AUTONOMIA LO STRUMENTO PIÙ APPROPRIATO IN FUNZIONE DEL PROBLEMA SPECIFICO DA RISOLVERE; - CAPACITÀ DI UTILIZZARE I PRINCIPALI STRUMENTI COMPUTAZIONALI PER LA SOLUZIONE DI PROBLEMI DI RILEVANZA PRATICA NEL CONTESTO DEI BIG DATA |
Prerequisiti | |
---|---|
CONOSCENZE DI: - PRINCIPALI STRUMENTI DI ANALISI MATEMATICA - ALGEBRA DELLE MATRICI - CALCOLO DELLE PROBABILITÀ - ELEMENTI DI ANALISI STATISTICA DESCRITTIVA E VISUALIZZAZIONE DEI DATI |
Contenuti | |
---|---|
IL CORSO COMPRENDE I SEGUENTI ARGOMENTI - APPRENDIMENTO STATISTICO E PREVISIONE - ERRORE DI PREVISIONE E BIAS-VARIANCE TRADE-OFF - GEOMETRIA DEI DATI MULTIVARIATI: METRICHE LP, DISSIMILARITÀ, FORME ELLITTICO-SIMMETRICHE E CORRELAZIONE. - APPRENDIMENTO SUPERVISIONATO E CLASSIFICAZIONE - ALGORITMI DI CLASSIFICAZIONE: LDA, QDA, KNN, LOGISTIC REGRESSION - STIMA DELLE COMPONENTI DEL MISCLASSIFICATION ERROR - METODI DI RESAMPLING: CROSS-VALIDATION E BOOTSTRAP - APPRENDIMENTO NON SUPERVISIONATO - DATA REDUCTION: PCA, ICA, MDS - ALGORITMI DI CLUSTERING: K-MEANS, K-MEDOIDS, METODI GERARCHICI, MODEL-BASED - IL PROBLEMA DEL NUMERO DI GRUPPI E VALIDAZIONE DELLA SOLUZIONE DI CLUSTERING - CENNI SU ALTRI METODI DI APPRENDIMENTO AVANZATI: SVM, CLASSIFICATION TREES E RANDOM FOREST, BAGGING, BOOSTING, DENSITY-BASED CLUSTERING, HIGH-DIMENSIONAL LDA E QDA. |
Metodi Didattici | |
---|---|
LEZIONI FRONTALI, ESERCITAZIONI ED ANALISI DI STUDI DI CASO |
Verifica dell'apprendimento | |
---|---|
L'ESAME PREVEDE LO SVOLGIMENTO DI UNA PROVA SCRITTA, IN LABORATORIO, E UNA ORALE. ENTRAMBE LE PROVE SONO VALUTATE SU UNA SCALA IN TRENTESIMI. PER ACCEDERE ALLA PROVA ORALE È NECESSARIO SUPERARE LA PROVA SCRITTA CON ALMENO 18/30. LA PROVA SCRITTA (DURATA CIRCA 1.5 H). DURANTE LA PROVA SCRITTA LO STUDENTE RICEVERÀ UNA TRACCIA D’ESAME E SARÀ CHIAMATO A RISPONDERE A 10 DOMANDE (DA 1 PUNTO FINO 3 PUNTI) SULL’INTERO PROGRAMMA DEL CORSO, UTILIZZANDO UN DATASET FORNITO IN SEDE DI ESAME. LA PROVA ORALE (DURATA CIRCA 15 MIN) E' TESA AD APPROFONDIRE IL LIVELLO DELLE CONOSCENZE, L'AUTONOMIA DI ANALISI E GIUDIZIO, NONCHE' LE CAPACITA' ESPOSITIVE DELLO STUDENTE. LA VALUTAZIONE DELLE PROVE TIENE CONTO DELLA EFFICACIA DEI METODI UTILIZZATI, DELLA COMPLETEZZA ED ESATTEZZA DELLE RISPOSTE, NONCHE' DELLA CHIAREZZA NELLA PRESENTAZIONE. IL VOTO FINALE, ESPRESSO IN TRENTESIMI CON EVENTUALE LODE, TIENE CONTO DELL'ESITO DELLE DUE PROVE. |
Testi | |
---|---|
NOTE DIDATTICHE E RIFERIMENTI BIBLIOGRAFICI DISPONIBILI ON-LINE FORNITI DAL DOCENTE DURANTE IL CORSO JAMES, G., WITTEN, D., HASTIE, T., & TIBSHIRANI, R. (2013). AN INTRODUCTION TO STATISTICAL LEARNING (VOL. 112, PP. 3-7). NEW YORK: SPRINGER. |
Altre Informazioni | |
---|---|
INFORMAZIONI AGGIUNTIVE SARANNO DISPONIBILI ON-LINE SULLA PAGINA WEB DEL DOCENTE DEDICATA AL CORSO. LA FREQUENZA, PUR NON ESSENDO OBBLOGATORIA, È FORTEMENTE CONSIGLIATA. |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2022-05-23]