ANALISI STATISTICA PER L'AMBIENTE

OLGA SACCO ANALISI STATISTICA PER L'AMBIENTE

0512700034
DIPARTIMENTO DI CHIMICA E BIOLOGIA "ADOLFO ZAMBELLI"
CORSO DI LAUREA
SCIENZE AMBIENTALI
2024/2025

OBBLIGATORIO
ANNO CORSO 2
ANNO ORDINAMENTO 2022
SECONDO SEMESTRE
CFUOREATTIVITÀ
432LEZIONE
224ESERCITAZIONE
Obiettivi
L’INSEGNAMENTO HA COME OBIETTIVO GENERALE QUELLO DI CONTRIBUIRE ALLA FORMAZIONE DI UN OPERATORE AMBIENTALE ESPERTO NEI VARI ASPETTI DELLA ANALISI STATISTICA IN CAMPO AMBIENTALE.
IN DETTAGLIO, OBIETTIVO PECULIARE DELL’INSEGNAMENTO È FORNIRE ALLO STUDENTE LE CONOSCENZE, E LE CAPACITÀ DI APPLICAZIONE DELLE STESSE, RIGUARDO AL RAGIONAMENTO STATISTICO, COME ORGANIZZARE I DATI, PRODURRE GRAFICI DESCRITTIVI ED ESPLORATIVI, COMPRENDERE L’UTILIZZO DI MODELLI STATISTICI PER L’ANALISI DEI DATI, SPIEGARE COME COMUNICARE E DISCUTERE I RISULTATI DI UN’ANALISI DI DATI AMBIENTALI.

CONOSCENZA E CAPACITÀ DI COMPRENSIONE (DESCRITTORE DI DUBLINO N.1)
L’INSEGNAMENTO HA L’OBIETTIVO DI PERMETTERE ALLO STUDENTE DI ARRIVARE ALLA CONOSCENZA, CON IL SUPPORTO DI LIBRI DI TESTO AVANZATI, DEI CONCETTI DI BASE DELL’ANALISI STATISTICA CHE RIGUARDA:
-ASPETTI TEORICO-METODOLOGICI
-ASPETTI TECNICO-PRATICI MEDIANTE L’UTILIZZO DEL LIGUAGGIO STATISTICO R.
E’ ANCHE OBIETTIVO DELL’INSEGNAMENTO DARE ALLO STUDENTE GLI STRUMENTI PER ELABORARE E/O APPLICARE IDEE INNOVATIVE, EVENTUALMENTE ANCHE IN AMBITI DI RICERCA, PER ANALIZZARE SET DI DATI AMBIENTALI UTILIZZANDO TECNICHE STATISTICHE APPROPRIATE.
INFINE, L’INSEGNAMENTO INTENDE FORNIRE ALLO STUDENTE, LE CONOSCENZE UTILI PER COMPRENDERE E AFFRONTARE TEMI D’AVANGUARDIA NEL CAMPO:
-DELLA SCELTA DI DATI STATISTICAMENTE AFFIDABILI
-DELLA STATISTICA APPLICATA ALL’ANALISI DEI DATI AMBIENTALI


CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE (DESCRITTORE DI DUBLINO N.2)
L’INSEGNAMENTO SI PROPONE L’OBIETTIVO DI METTERE IN CONDIZIONE LO STUDENTE DI IDEARE E SOSTENERE ARGOMENTAZIONI CHE AFFRONTINO LE PROBLEMATICHE RELATIVE ALLA RACCOLTA DEI DATI AMBIENTALI IN MODO INDIRETTO O DIRETTO ANCHE CON L'UTILIZZO DI METODI STATISTICI MULTIVARIATI E DI SOFTWARE SPECIALISTICI (AMBIENTE R).
LE CONOSCENZE APPRESE CONSENTIRANNO ALLO STUDENTE DI RISOLVERE PROBLEMI, IN AMBITI NUOVI (NON FAMILIARI) E INTERDISCIPLINARI, RELATIVI ALL’ANALISI STATISTICA PER L’AMBIENTE, SIA DAL PUNTO DI VISTA TEORICO SIA PER QUELLO CHE RIGUARDA GLI ASPETTI PRATICI.

AUTONOMIA DI GIUDIZIO (DESCRITTORE DI DUBLINO N.3)
L’INSEGNAMENTO HA L’OBIETTIVO DI METTERE IN GRADO LO STUDENTE DI RACCOGLIERE E INTERPRETARE DATI RILEVANTI RELATIVAMENTE ALLE PROBLEMATICHE AMBIENTALI PER UNA CORRETTA IMPOSTAZIONE (O VALUTAZIONE) DI UN MODELLO STATISTICO. IN DETTAGLIO, LO STUDENTE SARÀ CAPACE DI INTEGRARE AUTONOMAMENTE LE PROPRIE CONOSCENZE COSÌ DA GESTIRE AL MEGLIO LA COMPLESSITÀ DELLE PROBLEMATICHE RELATIVE AGLI ASPETTI TEORICI RELATIVI ALL’ANALISI STATISTICA AMBIENTALE, FORMULANDO GIUDIZI, ANCHE CON DATI PARZIALI, BASATI SULLA SCELTA DEI METODI STATISTICI PIÙ APPROPRIATI PER L’ANALISI DI FENOMENI AMBIENTALI E SULLA CONOSCENZA DELLE IPOTESI CHE GIUSTIFICHINO I METODI UTILIZZATI.

ABILITÀ COMUNICATIVE (DESCRITTORE DI DUBLINO N.4)
L’INSEGNAMENTO METTERÀ IN CONDIZIONE LO STUDENTE DI COMUNICARE, A INTERLOCUTORI SPECIALISTI E NON, CONCETTI E CONCLUSIONI, COSÌ COME LA RATIO A ESSE SOTTESA, FRUTTO DELLE CONOSCENZE DA ESSO ACQUISITE, RELATIVAMENTE ALL’ANALISI STATITICA AMBIENTALE SIA PER QUELLO CHE RIGUARDA GLI ASPETTI TEORICO- METODOLOGICI, SIA RELATIVAMENTE AI AGLI ASPETTI TECNICO- PRATICI.

CAPACITÀ DI APPRENDERE (DESCRITTORE DI DUBLINO N.5)
L’INSEGNAMENTO FORNIRÀ ALLO STUDENTE LE COMPETENZE NECESSARIE PER UNO STUDIO AUTOGESTITO E AUTONOMO, CHE GLI PERMETTA DI TROVARE PERCORSI INDIVIDUALI PER AFFRONTARE I COMPLESSI E MULTIDISCIPLINARI PROBLEMI DELL’AMBIENTE STATISTICO R PER LA STIMA DEL MODELLO E LA VALUTAZIONE DELLA SUA BONTÀ DI ADATTAMENTO.
Prerequisiti
GLI ARGOMENTI TRATTATI NEL CORSO RICHIEDONO DI AVERE LA CAPACITÀ DI UTILIZZARE GLI STRUMENTI DELL’ALGEBRA LINEARE QUALI MATRICI, VETTORI, E RELATIVE OPERAZIONI, IL CALCOLO DEGLI AUTOVALORI E DEGI AUTOVETTORI. E’ UTILE PER LO STUDENTE CHE VOGLIA SEGUIRE IL CORSO CON PROFITTO SAPER UTILIZZARE IL FORMALISMO MATEMATICO A LIVELLO DI UN CORSO UNIVERSITARIO DI MATEMATICA GENERALE. INOLTRE, IL CORSO RICHIEDE DI AVERE LA CAPACITÀ UTILIZZARE IL COMPUTER PER SVOLGERE LE ESERCITAZIONI PRATICHE. NON È RICHIESTA UNA CONOSCENZA PREGRESSA DEL LINGUAGGIO DI PROGRAMMAZIONE
Contenuti
L’INSEGNAMENTO È DIVISO IN ASPETTI TEORICO-METODOLOGICI (32 ORE DI DIDATTICA FRONTALE) ED ASPETTI TECNICO-APPLICATIVI (24 ORE DI DIDATTICA IN LABORATORIO) PER UN TOTALE DI 56 ORE E 6CFU.

GLI ASPETTI TEORICO-METODOLOGICI AFFRONTATI SONO:
-LA STATISTICA NELLA RICERCA AMBIENTALE
-IL DISEGNO SPERIMENTALE ED IL CAMPIONAMENTO
-TIPI DI DATI E SCALE DI MISURAZIONE.
-CLASSIFICAZIONE IN TABELLA.
-RAPPRESENTAZIONI GRAFICHE DI DISTRIBUZIONI UNIVARIATE.
-LE MISURE DI TENDENZA CENTRALE: MEDIA, MODA E MEDIANA.
-MISURE DI DISPERSIONE E VARIABILITÀ
-INDICI DI FORMA: SIMMETRIA E CUTOSI.
-DISTRIBUZIONI E LEGGI DI PROBABILITÀ
-ELEMENTI DI CALCOLO COMBINATORIO SEMPLICE
PERMUTAZIONI, DISPOSIZIONI E COMBINAZIONI SEMPLICI.
-DEFINIZIONE DI PROBABILITÀ.
-LE DISTRIBUZIONI DISCRETE: BINOMIALE, MULTINOMIALE, POISSONIANA, GEOMETRICA.
-LE DISTRIBUZIONI CONTINUE: UNIFORME, NORMALE O DI GAUSS, GAMMA, ESPONENZIALE,
-DISTRIBUZIONI CAMPIONARIE DERIVANTI DALLA NORMALE E UTILI PER L’INFERENZA: CHI-QUADRATO, T DI STUDENT, F DI FISCHER
-CONFRONTO TRA DISTRIBUZIONI OSSERVATE E ATTESE
-VERIFICA DELLE IPOTESI
-INFERENZA SU UNA O DUE MEDIE CON IL TEST T DI STUDENT
-TEST NON PARAMETRICI
-ANOVA
-REGRESSIONE LINEARE SEMPLICE.
-REGRESSIONE LINEARE MULTIPLA.
-APPROFONDIMENTI SULLA REGRESSIONE LINEARE: VALUTAZIONE DI UN MODELLO DI REGRESSIONE.
-MISURE DI DISTANZA, SIMILARITÀ E DISSIMILARITÀ: PROPRIETÀ MATEMATICHE ED ESEMPI.
-TRASFORMAZIONI DI VARIABILI CASUALI.
-INTRODUZIONE AL CLUSTERING,
-CLUSTERING GERARCHICO: IDEE, PRINCIPI ALLA BASE ED ALGORITMI
-CLUSTERING PARTIZIONALE: IDEE, PRINCIPI ALLA BASE ED ALGORITMI
GLI ASPETTI TECNICO-PRATICI AFFRONTATI SONO:
(ESERCITAZIONI SVOLTE MEDIANTE L’UTILIZZO DEL SOFTWARE STATISTICO R)
- INTRODUZIONE ALL’AMBIENTE DI PROGRAMMAZIONE R.
- R E I PACCHETTI DI R, ISTALLAZIONE E GESTIONE DEL SOFTWARE ATTRAVERSO LINEA DI COMANDO.
- R STUDIO.
-DATI E STRUTTURE DATI IN R
-LETTURA E SCRITTURA FILE IN R
-UTILIZZO DI FUNZIONI GRAFICHE IN R
-STRUTTURE DI CONTROLLO IN R
-FUNZIONI E GRAFICI DELLA STATISTICA DESCRITTIVA IN R
-DISTRIBUZIONI DI PRABABIOLITA' IN R
-REGRESSIONE LINEARE SEMPLICE IN R
-REGRESSIONE LINEARE MULTIPLA IN R
Metodi Didattici
L’INSEGNAMENTO PREVEDE 56 ORE DI DIDATTICA TRA LEZIONI ED ESERCITAZIONI PRATICHE (6 CFU). IN PARTICOLARE SONO PREVISTE 32 ORE DI DIDATTICA FRONTALE SUGLI ASPETTI TEORICO-METODOLOGICI E 24 ORE DI ESERCITAZIONI IN AULA CON IL COMPUTER PER GLI ASPETTI TECNICO-APPLICATIVI.
IL CORSO È ORGANIZZATO NEL SEGUENTE MODO: LEZIONI IN AULA SU TUTTI GLI ARGOMENTI DEL CORSO (16 LEZIONI DI 2 ORE CIASCUNA), ESERCITAZIONI PRATICHE CON IL COMPUTER SU TUTTI GLI ARGOMENTI DEL CORSO (8 LEZIONI DI 3 ORE CIASCUNA). LE ESERCITAZIONI TECNICO-PRATICHE SEGUIRANNO LE LEZIONI TEORICHE SULLO STESSO ARGOMENTO.
PER LE ESERCITAZONI PRATICHE GLI STUDENTI UTILIZZARANNO IL PROPRIO COMPUTER E DOVRANNO ISTALLARE IL SOFTWARE STATISTICO R (CHE È OPEN-SOURCE).
PER LE ESERCITAZIONI PRATICHE GLI STUDENTI POTRANNO LAVORARE SIA IN MODO INDIVIDUALE CHE DIVISI IN COPPIE.
PER CIASCUNA PARTE DEL CORSO VERRÀ FORNITO MATERIALE DIDATTICO SPECIFICO CONSISTENTE IN SLIDES DEL CORSO, ESEMPI DI DATASET E ESERCIZI TIPICI SVOLTI MEDIANTE L’UTILIZZO DEL SOFTWARE STATISTICO R.
IL MATERIALE VERRÀ FORNITO ALL'INIZIO DEL CORSO. GLI STUDENTI SONO INVITATI A LEGGERE IL MATERIALE FORNITO PRIMA DELLA LEZIONE CORRISPONDENTE AL FINE DI RENDERE PIÙ INTERATTIVA E PROFICUA LA LEZIONE STESSA
Verifica dell'apprendimento
IIL RAGGIUNGIMENTO DEGLI OBIETTIVI DELL’INSEGNAMENTO È CERTIFICATA MEDIANTE IL SUPERAMENTO DI UN ESAME CON VALUTAZIONE IN TRENTESIMI E SI INTENDE SUPERATA CON IL VOTO MINIMO DI 18/30.
L’ESAME PREVEDE UNA PROVA SCRITTA ED UNA PROVA PRATICA.
IL VOTO FINALE DIPENDE DAI PUNTEGGI RIPORTATI NELLE SINGLE PROVE.
LA PROVA SCRITTA CONSISTE IN 10 DOMANDE SUI CONTENUTI TEORICI E METODOLOGICI INDICATE NEL PROGRAMMA DELL’INSEGNAMENTO (1 PUNTO A DOMANDA).
LA PROVA PRATICA CONSISTE IN UNA SERIE DI ESERCIZI DA SVOLGERE CON IL SUPPORTO DEL SOFTWARE STATISTICO MEDIANTE I METODI PRESENTI NEL PROGRAMMA DI INSEGNAMENTO (PER UN TOTALE DI 20 PUNTI). IL VOTO MASSIMO (30/30) È RAGGIUNTO QUANDO LO STUDENTE RISPONDE CORRETTAMENTE ALLE DOMANDE TEORICHE E SVOLGE CORRETTAMENTE GLI ESERCIZI PROPOSOSTI .
Testi
1)WALTER W. PIEGORSCH, A. JOHN BAILER “ANALYZING ENVIRONMENTAL DATA” – WILEY (2005)
2)RICHARD G. BRERETON “CHEMOMETRICS – DATA ANALYSIS FOR THE LABORATORY AND CHEMICAL PLANT” – WILEY (2003)
3)PETER DALGAARD - "INTRODUCTORY STATISTICS WITH R" - SPRINGER
4)APPUNTI DEL CORSO
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-18]