DATA ANALYSIS AND STATISTICAL MODELING

Giuseppina ALBANO DATA ANALYSIS AND STATISTICAL MODELING

0222800003
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS
CORSO DI LAUREA MAGISTRALE
DATA SCIENCE E GESTIONE DELL'INNOVAZIONE
2023/2024



OBBLIGATORIO
ANNO CORSO 1
ANNO ORDINAMENTO 2022
SECONDO SEMESTRE
CFUOREATTIVITÀ
963LEZIONE
Obiettivi
L’OBIETTIVO PRINCIPALE DEL CORSO È DI CONSENTIRE AGLI STUDENTI DI ACQUISIRE CONOSCENZE RELATIVE ALLE PRINCIPALI TECNICHE: I) DI ANALISI E VISUALIZZAZIONE DEI DATI; II) DI INFERENZA STATISTICA; III) DI
COSTRUZIONE DI MODELLI PREDITTIVI.
AL TERMINE DEL CORSO, GLI STUDENTI AVRANNO, ALTRESÌ, ACQUISITO LE CONOSCENZE COMPUTAZIONALI NECESSARIE PER UNA CORRETTA IMPLEMENTAZIONE DELLE TECNICHE DI INFERENZA STATISTICA CLASSICA, FACENDO RICORSO AL LINGUAGGIO DI PROGRAMMAZIONE “R”.
OLTRE ALLE CONOSCENZE, GLI STUDENTI SVILUPPERANNO:
I) LE ABILITÀ NECESSARIE PER ANALIZZARE ED INTERPRETARE INFORMAZIONI DI NATURA QUANTITATIVA E PRODURRE INDICATORI, MODELLI STATISTICI E REPORT DI SUPPORTO ALL'ATTIVITÀ DECISIONALE IN DIVERSI AMBITI;
II) LA CAPACITÀ DI ANALIZZARE E VALUTARE, NONCHÉ DI PRESENTARE AUTONOMAMENTE DOCUMENTI CHE INCLUDONO INFORMAZIONI DI TIPO QUANTITATIVO, FORMULANDO GIUDIZI CRITICI SULLE MODALITÀ DI RACCOLTA DEI DATI, SULLE MODALITÀ DI ELABORAZIONE DELLE INFORMAZIONI RACCOLTE, SULLE TECNICHE DI INFERENZA, SUI MODELLI PREDITTIVI COSTRUITI E SULLA VALIDITÀ
DELLE CONCLUSIONI RAGGIUNTE.
Prerequisiti
DURANTE LE LEZIONI SARANNO RICHIAMATE ALCUNE NOZIONI BASE SU:
0. STATISTICA DESCRITTIVA
1. CALCOLO ELEMENTARE DELLE PROBABILITÀ
2. VARIABILI CASUALI: DEFINIZIONE, FUNZIONE DI RIPARTIZIONE, VALORE ATTESO E VARIANZA, V.C. NOTEVOLI
3. STIMA PUNTUALE, PROPRIETÀ DEGLI STIMATORI, METODI DI COSTRUZIONE
4. VERIFICA DELLE IPOTESI: DEFINIZIONI, TEST Z
5. INTERVALLO DI CONFIDENZA: DEFINIZIONI, INTERVALLO DI CONFIDENZA Z
Contenuti
INTRODUZIONE ALL'ANALISI MULTIVARIATA DEI DATI (23 H)
1. MANIPOLAZIONE DEI DATI
2. R, R-STUDIO, OGGETTI IN R, PACCHETTI IN R, IMPORT/EXPORT DATA IN/DA R
3. VISUALIZZAZIONE DEI DATI - GRAFICI UNIVARIATI E BIVARIATI
4. VISUALIZZAZIONE DEI DATI - GRAFICI MULTIVARIATI
5. CREARE UN REPORT STATISTICO - RMARKDOWN

STATISTICA MULTIVARIATA: ANALISI DELLA INTERDIPENDENZA (UNSUPERVISED STATISTICAL LEARNING) (10 H)
1. ANALISI IN COMPONENTI PRINCIPALI: DEFINIZIONE DEGLI OBIETTIVI, SOLUZIONE, PROPRIETÀ DELLE
COMPONENTI, SELEZIONE DELLE COMPONENTI, INTERPRETAZIONE DEI RISULTATI, CERCHIO DELLE
CORRELAZIONI

COSTRUZIONE DI STIMATORI (10 H)
1. METODO DELLA MASSIMA VEROSIMIGLIANZA
2. STIMATORI MLE PER VARIABILI CASUALI (BERNOULLIANA, POISSON, NORMALE)
3. PROPRIETÀ DEGLI STIMATORI MLE


MODELLI STATISTICI PER L'ANALISI DELLA DIPENDENZA (20 H)
1. DEFINIZIONE DI MODELLO STATISTICO
2. MODELLI LINEARI E NON LINEARI
3. CLASSIFICAZIONE DEI MODELLI
4. REGRESSIONE LINEARE SEMPLICE: IPOTESI, INTERPRETAZIONE, STIMA MLE DEI PARAMETRI , BONTÀ DI
ADATTAMENTO, TEST T
5. REGRESSIONE LINEARE MULTIPLA: IPOTESI, INTERPRETAZIONE, STIMA DEI PARAMETRI, VALIDAZIONE DEL MODELLO, VIOLAZIONI DELLE IPOTESI
6. MODELLO LOGIT: IPOTESI, INTERPRETAZIONE, STIMA ML DEI PARAMETRI, TEST Z
Metodi Didattici
L'INSEGNAMENTO SI COMPONE DI 63 ORE DI DIDATTICA FRONTALE SUDDIVISE IN LEZIONI TEORICHE E COMPLEMENTI ED ESERCITAZIONI. LA FREQUENZA ALLE LEZIONI NON È OBBLIGATORIA MA È FORTEMENTE CONSIGLIATA.
Verifica dell'apprendimento
LA VALUTAZIONE DEL PROFITTO CONSISTE NELLA REDAZIONE E DISCUSSIONE DI UN REPORT STATISTICO SU UN DATASET REALE CONCORDATO CON IL DOCENTE.

LA PROVA ORALE, CONSISTENTE NELLA DISCUSSIONE DEL REPORT, È DELLA DURATA DI CIRCA 20
MINUTI E VERTE SUGLI ARGOMENTI TRATTATI NELLA PROVA SCRITTA E SUGLI
ARGOMENTI TEORICI DEL CORSO.
LA VALUTAZIONE FINALE SCATURISCE DALLA SOMMA DEI PUNTEGGI CONSEGUITI NEL REPORT E IN QUELLA ORALE: TALE PUNTEGGIO COMPLESSIVO
RAPPRESENTA IL VOTO FINALE (IN TRENTESIMI) E L'ESAME È SUPERATO SE ESSO RAGGIUNGE LA SOGLIA MINIMA DI 18.
NELLA VALUTAZIONE DELL'ESAME ORALE SI TERRÀ CONTO, OLTRE CHE DELLA CONOSCENZA DELLA MATERIA TRATTATA, ANCHE DELLA CAPACITÀ ESPOSITIVA, DELL'ACCURATEZZA DEL LINGUAGGIO E DELLA CAPACITÀ DI UTILIZZARE IN MODO CRITICO GLI STRUMENTI STATISTICI ACQUISITI.
Testi
· SLIDE FORNITE DAL DOCENTE
ANALISI DEI DATI E DATA MINING PER LE DECISIONI AZIENDALI, SERGIO ZANI, ANDREA CERIOLI, EDITORE: GIUFFRÈ.
R FOR DATA SCIENCE, GARRETT GROLEMUND E HADLEY WICKHAM,
Altre Informazioni
LA LINGUA D'INSEGNAMENTO È L'ITALIANO. GLI STUDENTI ERASMUS POSSONO EVENTUALMENTE CONCORDARE CON IL DOCENTE L’UTILIZZO DI LIBRI DI TESTO IN LINGUA INGLESE. LA FREQUENZA AL CORSO PUR NON OBBLIGATORIA, È VIVAMENTE CONSIGLIATA PER LE CARATTERISTICHE DELLA DISCIPLINA. LO STUDENTE NON FREQUENTANTE DEVE PREPARARE AUTONOMAMENTE IL PROGRAMMA PREVISTO.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-12-17]