DATA ANALYSIS AND STATISTICAL MODELING

Giuseppina ALBANO DATA ANALYSIS AND STATISTICAL MODELING

0222800003
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS
CORSO DI LAUREA MAGISTRALE
DATA SCIENCE E GESTIONE DELL'INNOVAZIONE
2024/2025



OBBLIGATORIO
ANNO CORSO 1
ANNO ORDINAMENTO 2022
SECONDO SEMESTRE
CFUOREATTIVITÀ
963LEZIONE
AppelloData
ALBANO30/01/2025 - 10:00
ALBANO30/01/2025 - 10:00
ALBANO13/02/2025 - 10:00
ALBANO13/02/2025 - 10:00
Obiettivi
L’OBIETTIVO PRINCIPALE DEL CORSO È DI CONSENTIRE AGLI STUDENTI DI ACQUISIRE CONOSCENZE RELATIVE ALLE PRINCIPALI TECNICHE: I) DI ANALISI E VISUALIZZAZIONE DEI DATI; II) DI INFERENZA STATISTICA; III) DI COSTRUZIONE DI MODELLI PREDITTIVI.

CONOSCENZA E CAPACITÀ DI COMPRENSIONE:
AL TERMINE DEL CORSO, GLI STUDENTI AVRANNO, ALTRESÌ, ACQUISITO LE CONOSCENZE COMPUTAZIONALI NECESSARIE PER UNA CORRETTA IMPLEMENTAZIONE DELLE TECNICHE DI INFERENZA STATISTICA CLASSICA, FACENDO RICORSO AL LINGUAGGIO DI PROGRAMMAZIONE “R”.
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE:
OLTRE ALLE CONOSCENZE, GLI STUDENTI SVILUPPERANNO: I) LE ABILITÀ NECESSARIE PER ANALIZZARE ED INTERPRETARE INFORMAZIONI DI NATURA QUANTITATIVA E PRODURRE INDICATORI, MODELLI STATISTICI E REPORT DI SUPPORTO ALL'ATTIVITÀ DECISIONALE IN DIVERSI AMBITI; II) LA CAPACITÀ DI ANALIZZARE E VALUTARE, NONCHÉ DI PRESENTARE AUTONOMAMENTE, DOCUMENTI CHE INCLUDONO INFORMAZIONI DI TIPO QUANTITATIVO, FORMULANDO GIUDIZI CRITICI SULLE MODALITÀ DI RACCOLTA DEI DATI, SULLE MODALITÀ DI ELABORAZIONE DELLE INFORMAZIONI RACCOLTE, SULLE TECNICHE DI INFERENZA, SUI MODELLI PREDITTIVI COSTRUITI E SULLA VALIDITÀ DELLE CONCLUSIONI RAGGIUNTE.

AUTONOMIA DI GIUDIZIO:
ALLA FINE DEL PERCORSO, LO STUDENTE SAPRÀ:
•VALUTARE IN MANIERA CRITICA E IMPLEMENTARE IN AUTONOMIA ADEGUATE SOLUZIONI DI DATA SCIENCE IN DIVERSI CONTESTI;
•VALUTARE LE POTENZIALITÀ E I LIMITI DI IMPIEGO DELLE TECNICHE E DEI MODELLI APPRESI;
•SCEGLIERE I CRITERI DECISIONALI, LE METODOLOGIE, LE TECNICHE E LE TECNOLOGIE PIÙ ADATTE ALLA SOLUZIONE DI PROBLEMI SPECIFICI E A CLASSI DI PROBLEMI.

ABILITÀ COMUNICATIVE:
RISPETTO ALLE ABILITÀ COMUNICATIVE, LO STUDENTE SAPRÀ:
•COMUNICARE IN MODO CHIARO E PRIVO DI AMBIGUITÀ CONOSCENZE, IDEE, PROBLEMI E SOLUZIONI, UTILIZZANDO APPROPRIATAMENTE LA TERMINOLOGIA TECNICA E ADEGUANDO LE MODALITÀ DI ESPRESSIONE ALLE CARATTERISTICHE CULTURALI E PROFESSIONALI DEI DESTINATARI DELLA COMUNICAZIONE;
•ATTUARE OPPORTUNE SINTESI PER COMUNICARE EFFICACEMENTE I RISULTATI DELL'ANALISI DEI DATI (ANCHE BIG DATA) ED EVIDENZIARNE GLI ASPETTI ESSENZIALI UTILI PER L'INDIVIDUAZIONE DELLE SOLUZIONI.

CAPACITÀ DI APPRENDIMENTO:
LO STUDENTE SVILUPPERÀ LE CAPACITÀ DI:
•STUDIARE IN MODO AUTONOMO, INTEGRANDO EFFICACEMENTE LE CONOSCENZE ACQUISITE;
•INTRAPRENDERE EFFICACEMENTE PERCORSI FORMATIVI DI LIVELLO SUPERIORE.








Prerequisiti
DURANTE LE LEZIONI SARANNO RICHIAMATE ALCUNE NOZIONI BASE SU:
0. STATISTICA DESCRITTIVA
1. CALCOLO ELEMENTARE DELLE PROBABILITÀ
2. VARIABILI CASUALI: DEFINIZIONE, FUNZIONE DI RIPARTIZIONE, VALORE ATTESO E VARIANZA, V.C. NOTEVOLI
3. STIMA PUNTUALE, PROPRIETÀ DEGLI STIMATORI, METODI DI COSTRUZIONE
4. VERIFICA DELLE IPOTESI: DEFINIZIONI, TEST Z
5. INTERVALLO DI CONFIDENZA: DEFINIZIONI, INTERVALLO DI CONFIDENZA Z
Contenuti
INTRODUZIONE ALL'ANALISI MULTIVARIATA DEI DATI (23 H)
1. MANIPOLAZIONE DEI DATI
2. R, R-STUDIO, OGGETTI IN R, PACCHETTI IN R, IMPORT/EXPORT DATA IN/DA R
3. VISUALIZZAZIONE DEI DATI - GRAFICI UNIVARIATI E BIVARIATI
4. VISUALIZZAZIONE DEI DATI - GRAFICI MULTIVARIATI
5. CREARE UN REPORT STATISTICO - RMARKDOWN

STATISTICA MULTIVARIATA: ANALISI DELLA INTERDIPENDENZA (UNSUPERVISED STATISTICAL LEARNING) (10 H)
1. ANALISI IN COMPONENTI PRINCIPALI: DEFINIZIONE DEGLI OBIETTIVI, SOLUZIONE, PROPRIETÀ DELLE
COMPONENTI, SELEZIONE DELLE COMPONENTI, INTERPRETAZIONE DEI RISULTATI, CERCHIO DELLE
CORRELAZIONI

COSTRUZIONE DI STIMATORI (10 H)
1. METODO DELLA MASSIMA VEROSIMIGLIANZA
2. STIMATORI MLE PER VARIABILI CASUALI (BERNOULLIANA, POISSON, NORMALE)
3. PROPRIETÀ DEGLI STIMATORI MLE


MODELLI STATISTICI PER L'ANALISI DELLA DIPENDENZA (20 H)
1. DEFINIZIONE DI MODELLO STATISTICO
2. MODELLI LINEARI E NON LINEARI
3. CLASSIFICAZIONE DEI MODELLI
4. REGRESSIONE LINEARE SEMPLICE: IPOTESI, INTERPRETAZIONE, STIMA MLE DEI PARAMETRI , BONTÀ DI
ADATTAMENTO, TEST T
5. REGRESSIONE LINEARE MULTIPLA: IPOTESI, INTERPRETAZIONE, STIMA DEI PARAMETRI, VALIDAZIONE DEL MODELLO, VIOLAZIONI DELLE IPOTESI
6. MODELLO LOGIT: IPOTESI, INTERPRETAZIONE, STIMA ML DEI PARAMETRI, TEST Z
Metodi Didattici
L'INSEGNAMENTO SI COMPONE DI 63 ORE DI DIDATTICA FRONTALE SUDDIVISE IN LEZIONI TEORICHE E COMPLEMENTI ED ESERCITAZIONI. LA FREQUENZA ALLE LEZIONI NON È OBBLIGATORIA MA È FORTEMENTE CONSIGLIATA.
Verifica dell'apprendimento
LA VALUTAZIONE DEL PROFITTO CONSISTE NELLA REDAZIONE E DISCUSSIONE DI UN REPORT STATISTICO SU UN DATASET REALE CONCORDATO CON IL DOCENTE. LA VOTAZIONE E' IN TRENTESIMI E LA PROVA RISULTA SUPERATA CON UNA VOTAZIONE MINIMA DI 18.

LA PROVA ORALE, CONSISTENTE NELLA DISCUSSIONE DEL REPORT, È DELLA DURATA DI CIRCA 20
MINUTI E VERTE SUGLI ARGOMENTI TRATTATI NELLA PROVA SCRITTA E SUGLI
ARGOMENTI TEORICI DEL CORSO.
LA VALUTAZIONE FINALE SCATURISCE DALLA MEDIA DEI PUNTEGGI CONSEGUITI NEL REPORT E IN QUELLA ORALE: TALE PUNTEGGIO COMPLESSIVO
RAPPRESENTA IL VOTO FINALE (IN TRENTESIMI) E L'ESAME È SUPERATO SE ESSO RAGGIUNGE LA SOGLIA MINIMA DI 18.
NELLA VALUTAZIONE DELL'ESAME ORALE SI TERRÀ CONTO, OLTRE CHE DELLA CONOSCENZA DELLA MATERIA TRATTATA, ANCHE DELLA CAPACITÀ ESPOSITIVA, DELL'ACCURATEZZA DEL LINGUAGGIO E DELLA CAPACITÀ DI UTILIZZARE IN MODO CRITICO GLI STRUMENTI STATISTICI ACQUISITI.
Testi
· SLIDE FORNITE DAL DOCENTE
ANALISI DEI DATI E DATA MINING PER LE DECISIONI AZIENDALI, SERGIO ZANI, ANDREA CERIOLI, EDITORE: GIUFFRÈ.
R FOR DATA SCIENCE, GARRETT GROLEMUND E HADLEY WICKHAM,
Altre Informazioni
LA LINGUA D'INSEGNAMENTO È L'ITALIANO. GLI STUDENTI ERASMUS POSSONO EVENTUALMENTE CONCORDARE CON IL DOCENTE L’UTILIZZO DI LIBRI DI TESTO IN LINGUA INGLESE. LA FREQUENZA AL CORSO PUR NON OBBLIGATORIA, È VIVAMENTE CONSIGLIATA PER LE CARATTERISTICHE DELLA DISCIPLINA. LO STUDENTE NON FREQUENTANTE DEVE PREPARARE AUTONOMAMENTE IL PROGRAMMA PREVISTO.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2025-01-27]