STATISTICA APPLICATA

Paolo ADDESSO STATISTICA APPLICATA

0612700133
DIPARTIMENTO DI INGEGNERIA DELL'INFORMAZIONE ED ELETTRICA E MATEMATICA APPLICATA
CORSO DI LAUREA
INGEGNERIA INFORMATICA
2024/2025



ANNO CORSO 3
ANNO ORDINAMENTO 2022
SECONDO SEMESTRE
CFUOREATTIVITÀ
324LEZIONE
18ESERCITAZIONE
216LABORATORIO
Obiettivi
L’INSEGNAMENTO MIRA A FORNIRE:
- I PRINCIPALI STRUMENTI PER VISUALIZZARE I DATI E DESCRIVERLI TRAMITE SEMPLICI MODELLI;
- I METODI PIÙ RILEVANTI PER PIANIFICARE LA RACCOLTA DI DATI, PER SOTTOPORRE A VERIFICA SPERIMENTALE I MODELLI, E ANALIZZARE L’EFFETTO DEI DIVERSI FATTORI DI INFLUENZA;
- I METODI PRINCIPALI PER COSTRUIRE E SOTTOPORRE A VERIFICA SPERIMENTALE MODELLI INTERPRETATIVI DI UN FENOMENO.
- LA CAPACITÀ DI UTILIZZARE I PRINCIPALI STRUMENTI SOFTWARE PER L’ANALISI DEI DATI.

CONOSCENZE E COMPRENSIONE
DESCRIZIONE DI FENOMENI NON DETERMINISTICI BASATA SULLA TEORIA DELLA PROBABILITÀ. ELEMENTI DI BASE DI STATISTICA DESCRITTIVA, PER SINTETIZZARE I DATI NELL’ANALISI UNIVARIATA E MULTIVARIATA, E DELL’INFERENZA STATISTICA. ANALISI DEI FATTORI PIÙ SIGNIFICATIVI NELLA DESCRIZIONE DI UN FENOMENO. MODELLI DI REGRESSIONE LINEARE. TEST PER VALUTARE LA SIGNIFICATIVITÀ STATISTICA.

APPLICAZIONE DELLE CONOSCENZE E DELLA COMPRENSIONE
ANALIZZARE SEMPLICI DATASET DI INTERESSE APPLICATIVO TRAMITE SOFTWARE DEDICATI PER APPLICAZIONI DI STATISTICA.
STIMARE I PARAMETRI DI MODELLI DI REGRESSIONE LINEARE DEI DATI.
PROGETTARE SEMPLICI ESPERIMENTI PER LA RACCOLTA DEI DATI E ANALIZZARE I FATTORI DI INFLUENZA TRAMITE ANALISI DELLA VARIANZA.
Prerequisiti
PREREQUISITI: ADEGUATE CONOSCENZE MATEMATICHE. NOZIONI DI PROBABILITÀ DI BASE.

PROPEDEUTICITÀ: ANALISI DEI SEGNALI.
Contenuti
UNITÀ DIDATTICA 1: INTRODUZIONE AL CORSO, RICHIAMI DI PROBABILITÀ, STATISTICA DESCRITTIVA E INTRODUZIONE A R (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 6/0/4)
-1 (ORE LEZIONE 2): INTRODUZIONE AL CORSO. RICHIAMI DI TEORIA DELLA PROBABILITÀ E CALCOLO COMBINATORIO, VARIABILI ALEATORIE E COEFFICIENTE DI CORRELAZIONE
-2 (ORE LEZIONE 2): VETTORI DI VARIABILI ALEATORIE. LEGGE DEI GRANDI NUMERI. TEOREMA LIMITE CENTRALE. RICHIAMI DEI PRINCIPALI MODELLI DI VV.AA.
-3 (ORE LEZIONE 2): INTRODUZIONE ALLA STATISTICA DESCRITTIVA: ISTOGRAMMI, MEDIA, MEDIANA, MODA. INDICI DI DISPERSIONE: DEVIAZIONE STANDARD E VARIANZA CAMPIONARIA.
-4 (ORE LABORATORIO 2): INTRODUZIONE A R CON COMANDI DI BASE E DATAFRAME. VISUALIZZAZIONE IN R DEI TEOREMI ASINTOTICI E DEI CONCETTI DI STATISTICA DESCRITTIVA.
-5 (ORE LABORATORIO 2): ANALISI DI CORRELAZIONE TRAMITE R, SCATTER PLOT. BOX PLOT. CORRELATION PLOT.

CONOSCENZE E CAPACITÀ DI COMPRENSIONE
MODELLI PROBABILISTICI UTILI ALLA STATISTICA. VETTORI DI VARIABILI ALEATORIE E DISTRIBUZIONI CONGIUNTE E MARGINALI. CONOSCENZA DEI TEOREMI FONDAMENTALI DI PROBABILITÀ PER ANALIZZARE I DATI. INDICATORI E STRUMENTI GRAFICI PER DESCRIVERE IL COMPORTAMENTO DI QUANTITÀ ALEATORIE MISURATE. ANALIZZARE LA CORRELAZIONE TRA GRANDEZZE ALEATORIE.

CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE
UTILIZZO DI GRAFICI E TABELLE DI USO COMUNE IN STATISTICA. UTILIZZO DI SEMPLICI DATASET TRAMITE SOFTWARE DI ANALISI DATI. CALCOLO E VISUALIZZAZIONE DELLA DISTRIBUZIONE DI VARIABILI ALEATORIE. VISUALIZZARE LA CORRELAZIONE TRA VARIABILI.


UNITÀ DIDATTICA 2: STATISTICA INFERENZIALE (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 6/2/4)
-6 (ORE LEZIONE 2): ELEMENTI DI TEORIA DELLA STIMA: STIMA PUNTUALE E INTERVALLARE. STIMA DELLA MEDIA DI POPOLAZIONE NORMALE CON VARIANZA NOTA.
-7 (ORE LEZIONE 2): DISTRIBUZIONI CHI QUADRATO E T DI STUDENT. STIMA INTERVALLARE DELLA MEDIA E VARIANZA DI POPOLAZIONE NORMALE CON VARIANZA INCOGNITA. INTERVALLI DI CONFIDENZA UNILATERALI. ESEMPI DI STIMA INTEVALLARE
-8 (ORE LEZIONE 2): STIMATORI E LORO PROPRIETÀ (LINEARITÀ, CORRETTEZZA, EFFICIENZA, CONSISTENZA, ASINTOTICA NORMALITÀ, SUFFICIENZA). MSE E CENNI AL “TRADE OFF BIAS-VARIANZA”. FUNZIONE DI VEROSIMIGLIANZA.
-9 (ORE ESERCITAZIONE 2): ESEMPI DI FUNZIONE DI VEROSIMIGLIANZA. ESERCIZI SULLA STIMATORE A MASSIMA VEROSIMIGLIANZA (MAXIMUM LIKELIHOOD – ML).
-10 (ORE LABORATORIO 2): INTERVALLI DI CONFIDENZA, DISTRIBUZIONE CHI QUADRATO E T DI STUDENT IN R
-11 (ORE LABORATORIO 2): ESERCIZI DI STIMA ML IN R

CONOSCENZE E CAPACITÀ DI COMPRENSIONE
STIMA DEI PARAMETRI DI DISTRIBUZIONI DI USO COMUNE. COSTRUZIONE DEGLI INTERVALLI DI CONFIDENZA IN CASI SEMPLICI. PROPRIETÀ DEGLI STIMATORI IMPORTANTI PER L’APPRENDIMENTO STATISTICO.

CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE
STIMA DI MEDIA E VARIANZA DEI DATI RACCOLTI IN UN DATASET. CALCOLO DEGLI INTERVALLI DI CONFIDENZA DEI PARAMETRI A PARTIRE DA UN CAMPIONE ESTRATTO DA UNA POPOLAZIONE NORMALE. STIMA A MASSIMA VEROSIMIGLIANZA IN CASI DI UTILITÀ PRATICA.


UNITÀ DIDATTICA 3: VERIFICA (TEST) DI IPOTESI (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 8/2/2)
-12 (ORE LEZIONE 2): TEST DI IPOTESI. RISCHIO DI I E DI II SPECIE DI UN TEST D’IPOTESI. IPOTESI NULLA E REGIONE CRITICA.
-13 (ORE LEZIONE 2): VERIFICA DI IPOTESI SULLA MEDIA DI UNA POPOLAZIONE NORMALE, A VARIANZA NOTA: ESEMPIO DI UN TEST BILATERALE.
-14 (ORE ESERCITAZIONE 2): TEST SULLA MEDIA DI UNA POPOLAZIONE NORMALE, CON VARIANZA INCOGNITA: ESERCIZIO SU UN TEST UNILATERALE. ESERCIZIO: TEST SULLE DIFFERENZE DI MEDIE DI DUE NORMALI (CON STESSA VARIANZA).
-15 (ORE LEZIONE 2): TEST SULLA VARIANZA DI UN NORMALE. LIVELLO DI SIGNIFICATIVITÀ E POTENZA DI UN TEST. CURVA ROC E AUC.
-16 (ORE LEZIONE 2) BONTÀ DI ADATTAMENTO E Q-Q PLOT. LEMMA DI NEYMAN-PEARSON ED ESEMPIO DI TEST SULLA MEDIA DI UNA NORMALE A VARIANZA NOTA. DEFINIZIONE DEL “P-VALUE” E SUO USO NEI TEST DI IPOTESI.
-17 (ORE LABORATORIO 2) IMPLEMENTAZIONE DI TEST SULLA MEDIA DI UNA POPOLAZIONE NORMALE, A VARIANZA NOTA E INCOGNITA IN R. Q-Q PLOT E NORMALITÀ DEI DATI IN R.

CONOSCENZE E CAPACITÀ DI COMPRENSIONE
VERIFICA DELLE IPOTESI STATISTICHE ED ERRORI. TEST DI IPOTESI IN CASI NOTEVOLI. PRESTAZIONI DI UN TEST TRA DUE IPOTESI. VERIFICA DELL’IPOTESI DI NORMALITÀ.

CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE
IMPLEMENTAZIONE AL CALCOLATORE DI TEST DI IPOTESI SUI PARAMETRI DELLE VARIABILI IN SEMPLICI DATASET. BONTÀ DI ADATTAMENTO PER VIA GRAFICA.


UNITA DIDATTICA 4: PROGETTAZIONE DEGLI ESPERIMENTI, ANALISI DELLA VARIANZA, REGRESSIONE LINEARE (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 8/0/6)
-18 (ORE LEZIONE 2) ELEMENTI DI PROGETTAZIONE DEGLI ESPERIMENTI: PIANI COMPLETAMENTE CASUALIZZATI, PIANI A BLOCCHI CASUALIZZATI. ANALISI DELLA VARIANZA (ANOVA): DEFINIZIONE E STATISTICA TEST DI FISHER-SNEDECOR.
-19 (ORE LEZIONE 2) ANOVA PER PIANI COMPLETAMENTE CASUALIZZATI. ANOVA PER PIANI A BLOCCHI CASUALIZZATI. TEST DI TUKEY PER CONFRONTI MULTIPLI.
-20 (ORE LABORATORIO 2) ANOVA (1-WAY E 2-WAY) E TEST DI TUKEY IN R.
-21 (ORE LEZIONE 2) ANALISI DI REGRESSIONE: INTRODUZIONE E STIMATORI AI MINIMI QUADRATI, MEDIE E VARIANZE DEGLI STIMATORI. INTERVALLI DI CONFIDENZA SUI PARAMETRI.
-22 (ORE LEZIONE 2) TEST DI IPOTESI SUL PARAMETRO PENDENZA DELLA REGRESSIONE LINEARE SEMPLICE. REGRESSIONE POLINOMIALE CON ESEMPI.
-23 (ORE LABORATORIO 2) INTRODUZIONE ALL’ANALISI DI REGRESSIONE IN R.
-24 (ORE LABORATORIO 2) REGRESSIONE POLINOMIALE E DETERMINAZIONE DEL MODELLO POLINOMIALE PIÙ ADATTO IN AMBIENTE R.

CONOSCENZE E CAPACITÀ DI COMPRENSIONE
PROGETTARE SEMPLICI ESPERIMENTI PER LA RACCOLTA DEI DATI. ANALIZZARE I FATTORI DI INFLUENZA TRAMITE ANALISI DELLA VARIANZA. MODELLI DI REGRESSIONE LINEARE. TEST PER VALUTARE LA SIGNIFICATIVITÀ STATISTICA DEI PARAMETRI DEL MODELLO LINEARE. INDICI PER VALUTARE L’ADATTAMENTO DI UN MODELLO DI REGRESSIONE AI DATI.

CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE
APPLICAZIONE DELL’ANALISI DELLA VARIANZA A SEMPLICI DATASET E INDIVIDUAZIONE DEI FATTORI DI INFLUENZA DELLE GRANDEZZE MISURATE. COSTRUZIONE DI MODELLI DI REGRESSIONE SEMPLICE E POLINOMIALE A PARTIRE DA SEMPLICI DATASET. VALUTARE L’ADATTAMENTO DI UN MODELLO DI REGRESSIONE IN SEMPLICI DATASET.


TOTALE ORE LEZIONE/ESERCITAZIONE/LABORATORIO 28/4/16
Metodi Didattici
L’INSEGNAMENTO PREVEDE LEZIONI TEORICHE ED ESERCITAZIONI IN AULA E AL CALCOLATORE TRAMITE R SUGLI ARGOMENTI PROPOSTI.
PER POTER SOSTENERE LA VERIFICA FINALE DEL PROFITTO E CONSEGUIRE I CFU RELATIVI ALL’ATTIVITÀ FORMATIVA, LO STUDENTE DOVRÀ AVERE FREQUENTATO ALMENO IL 70% DELLE ORE PREVISTE DI ATTIVITÀ DIDATTICA ASSISTITA.
Verifica dell'apprendimento
L’ESAME PREVEDE UN PROGETTO DI GRUPPO E UN COLLOQUIO ORALE. IL PROGETTO MIRA A STABILIRE LE CAPACITÀ DI ANALIZZARE UN SEMPLICE DATASET TRAMITE IL SOFTWARE R. IL COLLOQUIO ORALE È FINALIZZATO A VALUTARE NEL SUO COMPLESSO: LA CAPACITÀ DI AFFRONTARE PROBLEMI DI STATISTICA APPLICATA ATTRAVERSO LE METODOLOGIE E GLI STRUMENTI ILLUSTRATI DURANTE IL CORSO; LA CONOSCENZA ED IL LIVELLO DI COMPRENSIONE DEI CONCETTI PRESENTATI AL CORSO. VENGONO ANCHE VALUTATE L’AUTONOMIA DI GIUDIZIO E LA CAPACITÀ ESPOSITIVA.
Testi
D. PICCOLO, STATISTICA PER LE DECISIONI. 3° ED., IL MULINO, 2020.
S. M. IACUS, G. MASAROTTO, LABORATORIO DI STATISTICA CON R, 2° ED., MCGRAW-HILL, 2014

TESTI DI SUPPORTO:
M. GUIDA, AFFIDABILITÀ, ARACNE, 2020.
A. PAPOULIS, S. U. PILLAI, PROBABILITY, RANDOM VARIABLES AND STOCHASTIC PROCESSES, 4TH ED., MCGRAW-HILL, 2001.

MATERIALE DIDATTICO INTEGRATIVO SARÀ DISPONIBILE NELLA SEZIONE DEDICATA DELL'INSEGNAMENTO ALL'INTERNO DELLA PIATTAFORMA E-LEARNING DI ATENEO (HTTP://ELEARNING.UNISA.IT) ACCESSIBILE AGLI STUDENTI DEL CORSO TRAMITE LE CREDENZIALI UNICHE DI ATENEO.
Altre Informazioni
LA LINGUA DELL’INSEGNAMENTO È L’ITALIANO.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-18]