Fabio POSTIGLIONE | STATISTICAL DATA ANALYSIS
Fabio POSTIGLIONE STATISTICAL DATA ANALYSIS
cod. 0622700059
STATISTICAL DATA ANALYSIS
0622700059 | |
DIPARTIMENTO DI INGEGNERIA DELL'INFORMAZIONE ED ELETTRICA E MATEMATICA APPLICATA | |
CORSO DI LAUREA MAGISTRALE | |
INGEGNERIA INFORMATICA | |
2020/2021 |
OBBLIGATORIO | |
ANNO CORSO 1 | |
ANNO ORDINAMENTO 2017 | |
SECONDO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | ||
---|---|---|---|---|---|
STATISTICAL DATA ANALYSIS (MODULO 1) | |||||
SECS-S/02 | 3 | 24 | LEZIONE | ||
SECS-S/02 | 3 | 24 | ESERCITAZIONE | ||
STATISTICAL DATA ANALYSIS (MODULO 2) | |||||
ING-INF/03 | 2 | 16 | LEZIONE | ||
ING-INF/03 | 1 | 8 | ESERCITAZIONE |
Obiettivi | |
---|---|
L’INSEGNAMENTO HA CARATTERE SIA METODOLOGICO CHE APPLICATIVO/PROGETTUALE. IL CORSO MIRA A ILLUSTRARE DAPPRIMA LE PRINCIPALI METODOLOGIE DI INTERESSE PER L'ANALISI STATISTICA DEI DATI. SUCCESSIVAMENTE, AD APPLICARE TALI METODOLOGIE A PROBLEMI DI RILEVANZA PRATICA, ATTRAVERSO L'IMPIEGO DI STRUMENTI PER L’ANALISI STATISTICA, LA VISUALIZZAZIONE E L’ELABORAZIONE DEI DATI. CONOSCENZE E COMPRENSIONE •ACQUISIZIONE DELLE PRINCIPALI TECNICHE DI INFERENZA STATISTICA E ANALISI DEI DATI. •APPROCCIO PARAMETRICO VS. APPROCCIO NON PARAMETRICO, METODI SUPERVISIONATI VS. METODI NON SUPERVISIONATI. •ACQUISIZIONE DELLE TECNICHE E DEI PRINCIPALI STRUMENTI PER L’ANALISI DI BIG DATA. APPLICAZIONE DELLE CONOSCENZE E DELLA COMPRENSIONE •CAPACITÀ DI APPLICARE LE PRINCIPALI METODOLOGIE DI ANALISI DEI DATI E INFERENZA STATISTICA A PROBLEMI PRATICI (ES., ANALISI DI DATI SOCIALI, BIOMEDICI). •CAPACITÀ DI ANALIZZARE GRANDI MOLI DI DATI, ORGANIZZATI IN STRUTTURE COMPLESSE, ETEROGENEE, E A ELEVATA DIMENSIONALITÀ. •CAPACITÀ DI UTILIZZARE STRUMENTI (ES., LINGUAGGIO R, MATLAB) PER L’ANALISI STATISTICA, LA VISUALIZZAZIONE E L’ELABORAZIONE DEI DATI. •CAPACITÀ DI UTILIZZARE I PRINCIPALI TOOL DI INTERESSE APPLICATIVO PER PROBLEMI DI DATA ANALYTICS. |
Prerequisiti | |
---|---|
PREREQUISITI: ADEGUATE CONOSCENZE MATEMATICHE E DEGLI ELEMENTI DI BASE DI PROBABILITÀ E STATISTICA. |
Contenuti | |
---|---|
- RICHIAMI DI STATISTICA DI BASE (ORE LEZIONE/ESERCITAZIONE: 7/3) INFERENZA STATISTICA, METODI PARAMETRICI. STIMA A MASSIMA VEROSIMIGLIANZA. TEORIA STATISTICA DELLA DECISIONE. APPROCCIO BAYESIANO. - NORMALIZZAZIONE DEI DATI. WHITENING (1/1) - INTRODUZIONE ALL'APPRENDIMENTO SUPERVISIONATO E MODELLI LINEARI (6/3) REGRESSIONE LINEARE MULTIPLA. MODELLI LINEARI GENERALIZZATI (GLM) - CLASSIFICAZIONE (11/5) REGRESSIONE LOGISTICA. LINEAR DISCRIMINANT ANALYSIS. FORMULAZIONE BAYESIANA DEI PROBLEMI DI REGRESSIONE/CLASSIFICAZIONE. ERRORE DI BIAS ED ERRORE DI VARIANZA. NAÏVE-BAYES. APPROCCI NON PARAMETRICI SUPERVISIONATI. ESEMPI: NAÏVE-KERNEL, METODI NN E K-NN - METODI DI RICAMPIONAMENTO (2/1) CROSS-VALIDATION (LOO, K-FOLD). BOOTSTRAP. - SELEZIONE DEI MODELLI LINEARI E REGOLARIZZAZIONE (9/3) SELEZIONE STEPWISE. RIDGE REGRESSION. LASSO. RIDUZIONE DELLA DIMENSIONALITÀ. PRINCIPAL COMPONENT REGRESSION. ESTENSIONI AL CASO HIGH-DIMENSIONAL DATA. CENNI ALLE TECNICHE DI SPARSIFICAZIONE PER BIG DATA ANALYTICS. - MODELLI ADDITIVI GENERALIZZATI E METODI BASATI SU ALBERI (1/0) - SUPPORT VECTOR MACHINES (1/0) - APPRENDIMENTO NON SUPERVISIONATO, ANALISI ALLE COMPONENTI PRINCIPALI E CLUSTERING (11/5) PRINCIPAL COMPONENTS ANALYSIS. CLUSTERING BASATO SU CENTROIDI: L'ALGORITMO K-MEANS. CLUSTERING GERARCHICO. ALTRI ESEMPI DI TECNICHE DI CLUSTERING. MISTURE DI GAUSSIANE E CLUSTERING BASATO SULL'ALGORITMO EXPECTATION-MAXIMIZATION. CLUSTERING BASATO SULLA DENSITÀ: L'ALGORITMO DBSCAN. - STATISTICA NON PARAMETRICA E CENNI DI FUNCTIONAL DATA ANALYSIS (2/0) - STRUMENTI DI CALCOLO: R MATLAB APACHE SPARKS |
Metodi Didattici | |
---|---|
L’INSEGNAMENTO PREVEDE LEZIONI TEORICHE ED ESERCITAZIONI IN AULA E AL CALCOLATORE. SUGLI ARGOMENTI PROPOSTI. |
Verifica dell'apprendimento | |
---|---|
L’ESAME CONSISTE NELLA DISCUSSIONE DI UN ELABORATO PROGETTUALE, ED È FINALIZZATO A VALUTARE NEL SUO COMPLESSO: LA CONOSCENZA E LA CAPACITÀ DI COMPRENSIONE DEI CONCETTI PRESENTATI AL CORSO; LA CAPACITÀ DI RISOLVERE PROBLEMI DI STATISTICAL DATA ANALYSIS ATTRAVERSO LE METODOLOGIE E GLI STRUMENTI ILLUSTRATI DURANTE IL CORSO. VENGONO ANCHE VALUTATE: L’AUTONOMIA DI GIUDIZIO, LA CAPACITÀ ESPOSITIVA E LA CAPACITÀ DI APPRENDERE. |
Testi | |
---|---|
AN INTRODUCTION TO STATISTICAL LEARNING, G. JAMES, D. WITTEN, T. HASTIE, R. TIBSHIRANI, SPRINGER, 2013. AN ELEMENTARY INTRODUCTION TO STATISTICAL LEARNING, S. KULKARNI, G. HARMAN, WILEY, 2010. |
Altre Informazioni | |
---|---|
LA LINGUA DELL'INSEGNAMENTO È L'INGLESE. |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2022-05-23]