DATA ANALYSIS AND STATISTICAL MODELING

Giuseppina ALBANO DATA ANALYSIS AND STATISTICAL MODELING

0222700018
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS
CORSO DI LAUREA MAGISTRALE
DATA SCIENCE E GESTIONE DELL'INNOVAZIONE
2021/2022

OBBLIGATORIO
ANNO CORSO 1
ANNO ORDINAMENTO 2020
SECONDO SEMESTRE
CFUOREATTIVITÀ
963LEZIONE
Obiettivi
AL TERMINE DEL CORSO GLI STUDENTI ACQUISIRANNO:

A) CONOSCENZE DELLE PRINCIPALI TECNICHE DI ANALISI E VISUALIZZAZIONE DEI DATI;

B) CONOSCENZE DELLE PRINCIPALI TECNICHE DI INFERENZA STATISTICA, ANCHE IN PRESENZA DI DATI CON STRUTTURA COMPLESSA;

C) CONOSCENZE DELLE PRINCIPALI TECNICHE PER LA COSTRUZIONE DI MODELLI PREDITTIVI.

GLI STUDENTI AVRANNO INOLTRE ACQUISITO LE ABILITÀ COMPUTAZIONALI NECESSARIE AD UNA CORRETTA IMPLEMENTAZIONE DELLE TECNICHE
DI INFERENZA STATISTICA CLASSICA. GLI STUDENTI ACQUISIRANNO:

(I) LA CAPACITÀ DI ANALIZZARE ED INTERPRETARE INFORMAZIONI DI NATURA QUANTITATIVA E DI PRODURRE INDICATORI,
MODELLI STATISTICI E REPORT DI SUPPORTO ALL'ATTIVITÀ DECISIONALE IN AMBITI DIVERSI;

(II) LA CAPACITÀ DI ANALIZZARE E VALUTARE, NONCHÉ DI PRESENTARE AUTONOMAMENTE DOCUMENTI CHE INCLUDONO
INFORMAZIONI DI TIPO QUANTITATIVO, FORMULANDO GIUDIZI CRITICI SULLE MODALITÀ DI RACCOLTA DEI DATI, SULLE MODALITÀ
DI ELABORAZIONE DELLE INFORMAZIONI RACCOLTE, SULLE TECNICHE DI INFERENZA E SUI MODELLI PREDITTIVI COSTRUITI NONCHÉ
SULLA VALIDITÀ DELLE CONCLUSIONI RAGGIUNTE.


(III) LA CAPACITÀ DI RACCORDARE LE COMPETENZE ACQUISITE CON QUELLE APPRESE NEI CORSI DI STUDIO PIÙ AFFINI.
Prerequisiti
DURANTE LE LEZIONI SARANNO RICHIAMATE ALCUNE NOZIONI BASE SU:
0. STATISTICA DESCRITTIVA
1. CALCOLO ELEMENTARE DELLE PROBABILITÀ
2. VARIABILI CASUALI: DEFINIZIONE, FUNZIONE DI RIPARTIZIONE, VALORE ATTESO E VARIANZA, V.C. NOTEVOLI
3. STIMA PUNTUALE, PROPRIETÀ DEGLI STIMATORI, METODI DI COSTRUZIONE
4. VERIFICA DELLE IPOTESI: DEFINIZIONI, TEST Z
5. INTERVALLO DI CONFIDENZA: DEFINIZIONI, INTERVALLO DI CONFIDENZA Z
Contenuti
INTRODUZIONE ALL'ANALISI MULTIVARIATA DEI DATI (20 H)
1. MANIPOLAZIONE DEI DATI
2. R, R-STUDIO, OGGETTI IN R, PACCHETTI IN R, IMPORT/EXPORT DATA IN/DA R
3. VISUALIZZAZIONE DEI DATI - GRAFICI UNIVARIATI AND BIVARIATI
4. VISUALIZZAZIONE DEI DATI - GRAFICI MULTIVARIATI
5. CREARE UN REPORT STATISTICO - RMARKDOWN

STATISTICA MULTIVARIATA: ANALISI DELLA INTERDIPENDENZA (UNSUPERVISED STATISTICAL LEARNING) (20 H)
1. ANALISI IN COMPONENTI PRINCIPALI: DEFINIZIONE DEGLI OBIETTIVI, SOLUZIONE, PROPRIETÀ DELLE
COMPONENTI, SELEZIONE DELLE COMPONENTI, INTERPRETAZIONE DEI RISULTATI, CERCHIO DELLE
CORRELAZIONI
2. ANALISI DEI GRUPPI: OBIETTIVI E DATI, DECOMPOSIZIONE DELLA DEVIANZA, METODO NON GERARCHICO (K-MEDIE), METODI GERARCHICI (WARD, DEL LEGAME SINGOLO, MEDIO, COMPLETO), DENDOGRAMMA,
SCELTA DEL NUMERO DI GRUPPI

MODELLI STATISTICI PER L'ANALISI DELLA DIPENDENZA (23 H)
1. DEFINIZIONE DI MODELLO STATISTICO
2. MODELLI LINEARI E NON LINEARI
3. CLASSIFICAZIONE DEI MODELLI
4. REGRESSIONE LINEARE SEMPLICE: IPOTESI, INTERPRETAZIONE, STIMA DEI PARAMETRI, BONTÀ DI
ADATTAMENTO, TEST T
5. REGRESSIONE LINEARE MULTIPLA: IPOTESI, INTERPRETAZIONE, STIMA DEI PARAMETRI, VALIDAZIONE DEL MODELLO, VIOLAZIONI DELLE IPOTESI
6. MODELLO LOGIT: IPOTESI, INTERPRETAZIONE, STIMA ML DEI PARAMETRI, TEST Z
7. MODELLO PROBIT: IPOTESI, INTERPRETAZIONE, STIMA ML DEI PARAMETRI, TEST Z.
Metodi Didattici
L'INSEGNAMENTO SI COMPONE DI 63 ORE DI DIDATTICA FRONTALE SUDDIVISE IN LEZIONI TEORICHE E COMPLEMENTI ED ESERCITAZIONI.
Verifica dell'apprendimento
LA VALUTAZIONE DEL PROFITTO CONSISTE NELLA REDAZIONE E DISCUSSIONE DI UN REPORT STATISTICO SU UN DATASET REALE CONCORDATO CON IL DOCENTE.

LA PROVA ORALE, CONSISTENTE NELLA DISCUSSIONE DEL REPORT, È DELLA DURATA DI CIRCA 20
MINUTI E VERTE SUGLI ARGOMENTI TRATTATI NELLA PROVA SCRITTA E SUGLI
ARGOMENTI TEORICI DEL CORSO.
LA VALUTAZIONE FINALE SCATURISCE DALLA SOMMA DEI PUNTEGGI CONSEGUITI NEL REPORT E IN QUELLA ORALE: TALE PUNTEGGIO COMPLESSIVO
RAPPRESENTA IL VOTO FINALE (IN TRENTESIMI) E L'ESAME È SUPERATO SE ESSO RAGGIUNGE LA SOGLIA MINIMA DI 18.
NELLA VALUTAZIONE DELL'ESAME ORALE SI TERRÀ CONTO, OLTRE CHE DELLA CONOSCENZA DELLA MATERIA TRATTATA, ANCHE DELLA CAPACITÀ ESPOSITIVA,
DELL'ACCURATEZZA DEL LINGUAGGIO E DELLA CAPACITÀ DI UTILIZZARE IN MODO CRITICO GLI STRUMENTI STATISTICI ACQUISITI.
Testi
· SLIDE FORNITE DAL DOCENTE
ANALISI DEI DATI E DATA MINING PER LE DECISIONI AZIENDALI, SERGIO ZANI, ANDREA CERIOLI, EDITORE: GIUFFRÈ.
R FOR DATA SCIENCE, GARRETT GROLEMUND E HADLEY WICKHAM,
Altre Informazioni
LA LINGUA D'INSEGNAMENTO È L'ITALIANO. GLI STUDENTI ERASMUS POSSONO EVENTUALMENTE CONCORDARE CON IL DOCENTE L’UTILIZZO DI LIBRI DI TESTO IN LINGUA INGLESE. LA FREQUENZA AL CORSO PUR NON OBBLIGATORIA, È VIVAMENTE CONSIGLIATA PER LE CARATTERISTICHE DELLA DISCIPLINA. LO STUDENTE NON FREQUENTANTE DEVE PREPARARE AUTONOMAMENTE IL PROGRAMMA PREVISTO.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2022-11-21]