Michele LA ROCCA | INFERENTIAL STATISTICS FOR BIG DATA
Michele LA ROCCA INFERENTIAL STATISTICS FOR BIG DATA
cod. 0222600009
INFERENTIAL STATISTICS FOR BIG DATA
0222600009 | |
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS | |
CORSO DI LAUREA MAGISTRALE | |
BUSINESS INNOVATION AND INFORMATICS - BUSINESS, INNOVAZIONE ED INFORMATICA | |
2018/2019 |
ANNO CORSO 2 | |
ANNO ORDINAMENTO 2016 | |
PRIMO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | |
---|---|---|---|---|
SECS-S/01 | 5 | 30 | LEZIONE |
Obiettivi | |
---|---|
GLI STUDENTI IMPARERANNO SIA LE TECNICHE DI INFERENZA STATISTICA CLASSICA SIA LE PRINCIPALI TECNICHE DI ESPLORAZIONE ED ANALISI DI DATASETS CARATTERIZZATI DA ALTA DIMENSIONALITÀ, SIA IN TERMINI DI NUMERO DI OSSERVAZIONI CHE IN TERMINI DI NUMERO DI FEATURES. GLI STUDENTI APPRENDERANNO SIA I CONCETTI TEORICI DI BASE SIA LE ABILITÀ COMPUTAZIONALI NECESSARIE AD UNA LORO CORRETTA IMPLEMENTAZIONE, INCLUSE LE TECNICHE CHE RENDONO LE ANALISI SCALABILI ED APPLICABILI A DATASET DISTRIBUITI. PIÙ IN DETTAGLIO, GLI STUDENTI ACQUISIRANNO: (I) LA CONOSCENZA DEGLI STRUMENTI DI ANALISI INFERENZIALE UTILI PER LA COMPRENSIONE DELLE PROBLEMATICHE E IL MIGLIORAMENTO DEI PROCESSI DECISIONALI CONNESSI; (II) LA CONOSCENZA DEI METODI DI TIPO DESCRITTIVO-ESPLORATIVO E INFERENZIALE, NECESSARI PER SUPPORTARE LE DECISIONI RELATIVE A FENOMENI E/O A SISTEMI IN CUI GRANDI QUANTITÀ DI DATI, VARIABILITÀ E INCERTEZZA DETERMINANO UN LIVELLO DI COMPLESSITÀ NON AFFRONTABILE CON ALTRE TECNICHE; (III) LA CAPACITÀ DI ANALIZZARE ED INTERPRETARE INFORMAZIONI DI NATURA QUANTITATIVA, E DI PRODURRE INDICATORI, MODELLI STATISTICI E REPORT DI SUPPORTO ALL'ATTIVITÀ DECISIONALE IN AMBITI DIVERSI. |
Prerequisiti | |
---|---|
È NECESSARIA LA CONOSCENZA DELLE PRINCIPALI NOZIONI DI PROBABILITÀ, DELLE TECNICHE STATISTICHE DI BASE E DI ALCUNE NOZIONI DI ANALISI MATEMATICA E DI CALCOLO MATRICIALE. |
Contenuti | |
---|---|
ANALISI ESPLORATIVA DEI DATI (EDA). MATRICI DI DATI E TRASFORMAZIONE DEI DATI. RELAZIONI TRA VARIABILI STATISTICHE. DIAGRAMMI SCATTER, BUBBLE PLOTS, COLORING AND FACETING PER DATI MULTIVARIATI. MATRICI DI CORRELAZIONE E LORO RAPPRESENTAZIONE GRAFICA. STRUMENTI SOFTWARE DISPONIBILI IN R BASATI SU HADOOP E SPARK PER LA GESTIONE, L’ANALISI E LA VISUALIZZAZIONE DI BIGDATA. CASI STUDIO IN R. LA LOGICA INFERENZIALE. PARAMETRI E STATISTICHE. CAMPIONI CASUALI E DISTRIBUZIONI CAMPIONARIE. TEOREMI DI CONVERGENZA ASINTOTICA. INFERENZA STATISTICA CLASSICA E PER BIGDATA. VERIFICA DI IPOTESI CLASSICA E IN CONDIZIONI DI ALTA DIMENSIONALITÀ. PROBLEMI DI TEST MULTIPLO, FAMILYWISE ERROR RATE E FALSE DISCOVERY RATE. TOOLS DISPONIBILI IN R PER INFERENZA CON BIG DATA UTILIZZANDO BASI DATI DISTRIBUITE. CASI STUDIO. MODELLI DI REGRESSIONE PER LO STUDIO DELLA DIPENDENZA. INFERENZA, VALIDAZIONE ED UTILIZZO DEL MODELLO SECONDO L’APPROCCIO CLASSICO E IN PRESENZA DI BIGDATA. IL PROBLEMA DELLA SELEZIONE DELLE VARIABILI. IL METODO LASSO E LE SUE GENERALIZZAZIONI. TOOLS DISPONIBILI IN R PER LA REGRESSIONE CON BIG DATA UTILIZZANDO BASI DATI DISTRIBUITE. CASI STUDIO. |
Metodi Didattici | |
---|---|
L'INSEGNAMENTO SI COMPONE DI 30 ORE DI LEZIONI ( 5 ECTS) CHE INCLUDONO TEORIA, ESERCITAZIONI E ANALISI DI STUDI DI CASO. |
Verifica dell'apprendimento | |
---|---|
L’ESAME CONSISTERÀ IN UNA VERIFICA, SIA SCRITTA CHE ORALE, SUI CONTENUTI DELL'INSEGNAMENTO. LA PROVA SCRITTA SI BASERÀ SU UN PROBLEMA E UN DATA SET PROPOSTO IN SEDE DI ESAME E CONSISTERÀ NELL'ELABORARE UN REPORT STATISTICO IN R/MARKDOWN USANDO L'AMBIENTE DI SVILUPPO RSTUDIO. NELLA VALUTAZIONE DELL'ESAME SI TERRÀ CONTO, OLTRE CHE DELLA CONOSCENZA DELLA MATERIA TRATTATA, ANCHE DELLA CAPACITÀ ESPOSITIVA, DELL'ACCURATEZZA DEL LINGUAGGIO E DELLA CAPACITÀ DI UTILIZZARE IN MODO CRITICO GLI STRUMENTI STATISTICI ACQUISITI. |
Testi | |
---|---|
1. COMPUTER AGE STATISTICAL INFERENCE, BRADLEY EFRON E TREVOR HASTY, CAMBRIDGE UNIVERSITY PRESS (CAPITOLI SELEZIONATI). 2. LECTURE NOTES E RIFERIMENTI SUGGERITI DAL DOCENTE DURANTE IL CORSO E DISPONIBILI SULLA PAGINA DOCENTE. |
Altre Informazioni | |
---|---|
LA FREQUENZA AL CORSO PUR NON OBBLIGATORIA, È VIVAMENTE CONSIGLIATA PER LE CARATTERISTICHE DELLA DISCIPLINA. LO STUDENTE NON FREQUENTANTE DEVE PREPARARE AUTONOMAMENTE IL PROGRAMMA PREVISTO. |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2019-10-21]