Giuseppina ALBANO | DATA ANALYSIS AND STATISTICAL MODELING
Giuseppina ALBANO DATA ANALYSIS AND STATISTICAL MODELING
cod. 0222700018
DATA ANALYSIS AND STATISTICAL MODELING
0222700018 | |
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS | |
CORSO DI LAUREA MAGISTRALE | |
DATA SCIENCE E GESTIONE DELL'INNOVAZIONE | |
2021/2022 |
OBBLIGATORIO | |
ANNO CORSO 1 | |
ANNO ORDINAMENTO 2020 | |
SECONDO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | |
---|---|---|---|---|
SECS-S/01 | 9 | 63 | LEZIONE |
Obiettivi | |
---|---|
AL TERMINE DEL CORSO GLI STUDENTI ACQUISIRANNO: A) CONOSCENZE DELLE PRINCIPALI TECNICHE DI ANALISI E VISUALIZZAZIONE DEI DATI; B) CONOSCENZE DELLE PRINCIPALI TECNICHE DI INFERENZA STATISTICA, ANCHE IN PRESENZA DI DATI CON STRUTTURA COMPLESSA; C) CONOSCENZE DELLE PRINCIPALI TECNICHE PER LA COSTRUZIONE DI MODELLI PREDITTIVI. GLI STUDENTI AVRANNO INOLTRE ACQUISITO LE ABILITÀ COMPUTAZIONALI NECESSARIE AD UNA CORRETTA IMPLEMENTAZIONE DELLE TECNICHE DI INFERENZA STATISTICA CLASSICA. GLI STUDENTI ACQUISIRANNO: (I) LA CAPACITÀ DI ANALIZZARE ED INTERPRETARE INFORMAZIONI DI NATURA QUANTITATIVA E DI PRODURRE INDICATORI, MODELLI STATISTICI E REPORT DI SUPPORTO ALL'ATTIVITÀ DECISIONALE IN AMBITI DIVERSI; (II) LA CAPACITÀ DI ANALIZZARE E VALUTARE, NONCHÉ DI PRESENTARE AUTONOMAMENTE DOCUMENTI CHE INCLUDONO INFORMAZIONI DI TIPO QUANTITATIVO, FORMULANDO GIUDIZI CRITICI SULLE MODALITÀ DI RACCOLTA DEI DATI, SULLE MODALITÀ DI ELABORAZIONE DELLE INFORMAZIONI RACCOLTE, SULLE TECNICHE DI INFERENZA E SUI MODELLI PREDITTIVI COSTRUITI NONCHÉ SULLA VALIDITÀ DELLE CONCLUSIONI RAGGIUNTE. (III) LA CAPACITÀ DI RACCORDARE LE COMPETENZE ACQUISITE CON QUELLE APPRESE NEI CORSI DI STUDIO PIÙ AFFINI. |
Prerequisiti | |
---|---|
DURANTE LE LEZIONI SARANNO RICHIAMATE ALCUNE NOZIONI BASE SU: 0. STATISTICA DESCRITTIVA 1. CALCOLO ELEMENTARE DELLE PROBABILITÀ 2. VARIABILI CASUALI: DEFINIZIONE, FUNZIONE DI RIPARTIZIONE, VALORE ATTESO E VARIANZA, V.C. NOTEVOLI 3. STIMA PUNTUALE, PROPRIETÀ DEGLI STIMATORI, METODI DI COSTRUZIONE 4. VERIFICA DELLE IPOTESI: DEFINIZIONI, TEST Z 5. INTERVALLO DI CONFIDENZA: DEFINIZIONI, INTERVALLO DI CONFIDENZA Z |
Contenuti | |
---|---|
INTRODUZIONE ALL'ANALISI MULTIVARIATA DEI DATI (20 H) 1. MANIPOLAZIONE DEI DATI 2. R, R-STUDIO, OGGETTI IN R, PACCHETTI IN R, IMPORT/EXPORT DATA IN/DA R 3. VISUALIZZAZIONE DEI DATI - GRAFICI UNIVARIATI AND BIVARIATI 4. VISUALIZZAZIONE DEI DATI - GRAFICI MULTIVARIATI 5. CREARE UN REPORT STATISTICO - RMARKDOWN STATISTICA MULTIVARIATA: ANALISI DELLA INTERDIPENDENZA (UNSUPERVISED STATISTICAL LEARNING) (20 H) 1. ANALISI IN COMPONENTI PRINCIPALI: DEFINIZIONE DEGLI OBIETTIVI, SOLUZIONE, PROPRIETÀ DELLE COMPONENTI, SELEZIONE DELLE COMPONENTI, INTERPRETAZIONE DEI RISULTATI, CERCHIO DELLE CORRELAZIONI 2. ANALISI DEI GRUPPI: OBIETTIVI E DATI, DECOMPOSIZIONE DELLA DEVIANZA, METODO NON GERARCHICO (K-MEDIE), METODI GERARCHICI (WARD, DEL LEGAME SINGOLO, MEDIO, COMPLETO), DENDOGRAMMA, SCELTA DEL NUMERO DI GRUPPI MODELLI STATISTICI PER L'ANALISI DELLA DIPENDENZA (23 H) 1. DEFINIZIONE DI MODELLO STATISTICO 2. MODELLI LINEARI E NON LINEARI 3. CLASSIFICAZIONE DEI MODELLI 4. REGRESSIONE LINEARE SEMPLICE: IPOTESI, INTERPRETAZIONE, STIMA DEI PARAMETRI, BONTÀ DI ADATTAMENTO, TEST T 5. REGRESSIONE LINEARE MULTIPLA: IPOTESI, INTERPRETAZIONE, STIMA DEI PARAMETRI, VALIDAZIONE DEL MODELLO, VIOLAZIONI DELLE IPOTESI 6. MODELLO LOGIT: IPOTESI, INTERPRETAZIONE, STIMA ML DEI PARAMETRI, TEST Z 7. MODELLO PROBIT: IPOTESI, INTERPRETAZIONE, STIMA ML DEI PARAMETRI, TEST Z. |
Metodi Didattici | |
---|---|
L'INSEGNAMENTO SI COMPONE DI 63 ORE DI DIDATTICA FRONTALE SUDDIVISE IN LEZIONI TEORICHE E COMPLEMENTI ED ESERCITAZIONI. |
Verifica dell'apprendimento | |
---|---|
LA VALUTAZIONE DEL PROFITTO CONSISTE NELLA REDAZIONE E DISCUSSIONE DI UN REPORT STATISTICO SU UN DATASET REALE CONCORDATO CON IL DOCENTE. LA PROVA ORALE, CONSISTENTE NELLA DISCUSSIONE DEL REPORT, È DELLA DURATA DI CIRCA 20 MINUTI E VERTE SUGLI ARGOMENTI TRATTATI NELLA PROVA SCRITTA E SUGLI ARGOMENTI TEORICI DEL CORSO. LA VALUTAZIONE FINALE SCATURISCE DALLA SOMMA DEI PUNTEGGI CONSEGUITI NEL REPORT E IN QUELLA ORALE: TALE PUNTEGGIO COMPLESSIVO RAPPRESENTA IL VOTO FINALE (IN TRENTESIMI) E L'ESAME È SUPERATO SE ESSO RAGGIUNGE LA SOGLIA MINIMA DI 18. NELLA VALUTAZIONE DELL'ESAME ORALE SI TERRÀ CONTO, OLTRE CHE DELLA CONOSCENZA DELLA MATERIA TRATTATA, ANCHE DELLA CAPACITÀ ESPOSITIVA, DELL'ACCURATEZZA DEL LINGUAGGIO E DELLA CAPACITÀ DI UTILIZZARE IN MODO CRITICO GLI STRUMENTI STATISTICI ACQUISITI. |
Testi | |
---|---|
· SLIDE FORNITE DAL DOCENTE ANALISI DEI DATI E DATA MINING PER LE DECISIONI AZIENDALI, SERGIO ZANI, ANDREA CERIOLI, EDITORE: GIUFFRÈ. R FOR DATA SCIENCE, GARRETT GROLEMUND E HADLEY WICKHAM, |
Altre Informazioni | |
---|---|
LA LINGUA D'INSEGNAMENTO È L'ITALIANO. GLI STUDENTI ERASMUS POSSONO EVENTUALMENTE CONCORDARE CON IL DOCENTE L’UTILIZZO DI LIBRI DI TESTO IN LINGUA INGLESE. LA FREQUENZA AL CORSO PUR NON OBBLIGATORIA, È VIVAMENTE CONSIGLIATA PER LE CARATTERISTICHE DELLA DISCIPLINA. LO STUDENTE NON FREQUENTANTE DEVE PREPARARE AUTONOMAMENTE IL PROGRAMMA PREVISTO. |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2022-11-21]