LABORATORIO DI INFORMATICA

Luigi TROIANO LABORATORIO DI INFORMATICA

0212800021
DIPARTIMENTO DI SCIENZE ECONOMICHE E STATISTICHE
CORSO DI LAUREA
STATISTICA PER I BIG DATA
2024/2025

ANNO CORSO 3
ANNO ORDINAMENTO 2018
SECONDO SEMESTRE
CFUOREATTIVITÀ
530LABORATORIO
AppelloData
TROIANO10/12/2024 - 11:00
TROIANO10/12/2024 - 11:00
Obiettivi
OBIETTIVO DEL CORSO È INTRODURRE LO STUDENTE ALLO SVILUPPO DI ALGORITMI PER IL
TRATTAMENTO DEI BIG DATA. VERRANNO INTRODOTTI PROBLEMI IN VARIE AREE DI APPLICAZIONE
DEI BIG DATA E SI STUDIERANNO STRATEGIE E MODELLI DI SOLUZIONE.
CONOSCENZA E CAPACITÀ DI COMPRENSIONE
DURANTE IL CORSO, LO STUDENTE ACQUISIRÀ UNA CONOSCENZA TEORICA E PRATICA DI PROBLEMI
RELATIVI AL TRATTAMENTO DEI BIG DATA IN VARI SETTORI APPLICATIVI, IN MODO DA ESSERE IN
GRADO DI ANALIZZARNE GLI ASPETTI COMPUTAZIONALI E DI TROVARE SOLUZIONI ALGORITMICHE
ADEGUATE. L’OBIETTIVO CONSISTE NELL’APPRENDERE SU COME UTILIZZARE AL MEGLIO LA VARIETÀ
DI SOLUZIONI DISPONIBILI, ORIENTANDONE LA SCELTA ATTRAVERSO UNA CONOSCENZA DELLE LORO
CARATTERISTICHE, ANCHE ATTRAVERSO ESEMPI PRATICI DI APPLICAZIONE.
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
L’IMPOSTAZIONE DEL CORSO INTENDE SVILUPPARE NELLO STUDENTE CONSAPEVOLEZZA CIRCA LA
PROGETTAZIONE E LA REALIZZAZIONE DI SOLUZIONI COMPUTAZIONALI PER I BIG DATA, ATTRAVERSO
LO STUDIO TEORICO E L’ESERCIZIO PRATICO SU ASPETTI INERENTI LA GESTIONE DELLA COMPLESSITÀ
DEI DIFFERENTI APPROCCI E DELLE CARATTERIZZAZIONI SPECIFICHE DEI DIFFERENTI AMBITI
APPLICATIVI.
Prerequisiti
L’INSEGNAMENTO PRESUPPONE LA CONOSCENZA DI PROGRAMMAZIONE; ALGORITMI E STRUTTURE DATI; ANALISI E VISUALIZZAZIONE DEI DATI; ARCHITETTURE PER I BIG DATA; MODELLI PROBABILISTICI PER L'ANALISI DEI DATI
Contenuti
RICHIAMI DI PYTHON

1. VARIABILI, TIPI DI DATI E OPERATORI.
2. STRUTTURE DI CONTROLLO: CONDIZIONI, CICLI E ISTRUZIONI BREAK/CONTINUE.
3. FUNZIONI: DEFINIZIONE, CHIAMATA E PARAMETRI.
4. GESTIONE DELLE ECCEZIONI CON TRY-EXCEPT.
5. STRUTTURE DATI: LISTE, DIZIONARI E TUPLE.
6. ARGOMENTI AVANZATI COME GESTIONE DEI FILE, PROGRAMMAZIONE ORIENTATA AGLI OGGETTI E MODULI SPECIFICI.

PANDAS

1. INTRODUZIONE A PANDAS
2. CARICAMENTO E MANIPOLAZIONE DEI DATI
3. PULIZIA E TRASFORMAZIONE DEI DATI
4. ANALISI DEI DATI
5. VISUALIZZAZIONE DEI DATI
6. ESPORTAZIONE DEI DATI

SCIKIT-LEARN:

1. INTRODUZIONE A SCIKIT-LEARN
2. PREPARAZIONE DEI DATI
3. MODELLI DI APPRENDIMENTO
4. VALUTAZIONE DEI MODELLI
5. OTTIMIZZAZIONE DEI MODELLI
6. UTILIZZO DI SCIKIT-LEARN CON ALTRI STRUMENTI

ALTRE LIBRERIE

1. DATA SOURCES
2. DATA VISUALIZATION
3. STATISTICS


IL CORSO DI LABORATORIO DI INFORMATICA INTENDE FORNIRE UN’ESPERIENZA PRATICA NELLA SOLUZIONE DI PROBLEMI DI ANALISI UTILIZZANDO PYTHON E LE RELATIVE LIBRERIE.

MODULO UNICO DI 30 ORE, DI CUI 8 DI LEZIONE FRONTALE E 22 DI ESERCITAZIONE.

IDEAZIONE, CODIFICA E VALIDAZIONE DI SOLUZIONI ALGORITMICHE NELLA COSTRUZIONE DI MODELLI PER L'ANALISI DATI BASATI SU PYTHON E LE SUE LIBRERIE PANDAS, SCIKIT-LEARN E PYSPARK.
Metodi Didattici
IL CORSO HA UN'IMPOSTAZIONE ORIENTATA ALLA PRATICA APPLICAZIONE DI TECNICHE PER IL CODING DI SOLUZIONI ALGORITMICHE.
Verifica dell'apprendimento
L’ESAME CONSISTE IN UN ELABORATO E IN UN TEST SCRITTO.
L’ELABORATO, CHE VIENE SVOLTO DALLO STUDENTE INDIVIDUALMENTE O IN GRUPPO, CONSISTE IN UN PICCOLO PROGETTO DIDATTICO IN CUI LO STUDENTE AVRÀ LA POSSIBILITÀ DI METTERSI ALLA PROVA CON L’APPLICAZIONE DELLE TECNOLOGIE APPRESE DURANTE IL CORSO E DI PRESENTARNE LA SOLUZIONE IN SEDE DI ESAME. IL TEST SCRITTO SEGUE LA PROVA LABORATORIALE ED È COMPOSTO DI 5 DOMANDE A RISPOSTA MULTIPLA. ESSO HA UNA DURATA DI 15 MINUTI E HA COME OBIETTIVO QUELLO DI VERIFICARE L’APPRENDIMENTO DELLE NOZIONI TECNICHE E METODOLOGICHE ILLUSTRATE AL CORSO.
Testi
APPUNTI DELLE LEZIONI
Altre Informazioni
E' RICHIESTA LA FREQUENZA REGOLARE AL CORSO SECONDO I CRITERI DEFINITI DALL’AREA DIDATTICA.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-18]