GESTIONE E VISUALIZZAZIONE DEI DATI

FRANCESCO BARDOZZO GESTIONE E VISUALIZZAZIONE DEI DATI

0212700188
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS
CORSO DI LAUREA
ECONOMIA E MANAGEMENT
2024/2025



ANNO CORSO 1
ANNO ORDINAMENTO 2023
SECONDO SEMESTRE
CFUOREATTIVITÀ
530LEZIONE
AppelloData
BARDOZZO19/12/2024 - 10:00
BARDOZZO19/12/2024 - 10:00
Obiettivi
L'OBIETTIVO DEL CORSO È QUELLO DI PROMUOVERE L'APPRENDIMENTO DI CONCETTI TEORICI LEGATI ALLA GESTIONE E ALLA VISUALIZZAZIONE DEI DATI ATTRAVERSO L'USO DEL LINGUAGGIO PYTHON E DI LIBRERIE DEDICATE. SI ILLUSTRERÀ COME RACCOGLIERE E ORGANIZZARE VARIE FONTI DI DATI E COME INTEGRARLE E CORRELARLE PER CREARE RAPPRESENTAZIONI VISIVE DI VALORE, INTERPRETABILI E UTILIZZABILI PER DESCRIVERE E ILLUSTRARE UN PARTICOLARE AMBITO APPLICATIVO. DI CONSEGUENZA, LE COMPETENZE TECNICHE RIGUARDANO LA PROGETTAZIONE DI UN SISTEMA IN PYTHON CAPACE DI ELABORARE DATI (PROVENIENTI DA SVARIATE FONTI) E DI VISUALIZZARLI IN MODO AUTOMATICO.

CONOSCENZA E CAPACITÀ DI COMPRENSIONE
1) CLASSIFICAZIONE E COMPRENSIONE CRITICA DEI DATI: APPRENDERE COME IMPORTARE E GESTIRE DATI DA DIVERSE FONTI UTILIZZANDO PYTHON E PANDAS ED ALTRI TOOLS FORNITI AL CORSO.
2) OBIETTIVI E MODALITÀ DELLA RICERCA DATI: CONOSCENZA DELLE PRINCIPALI LIBRERIE PYTHON PER L'ANALISI QUANTITATIVA E QUALITATIVA DEI DATI.
3) CONCETTI DI EFFICACIA ED EFFICIENZA NELLA MANIPOLAZIONE DEI DATI: APPLICARE TECNICHE EFFICIENTI PER LA MANIPOLAZIONE E LA VISUALIZZAZIONE DEI DATI CON PYTHON.
4) MISURE DI ESITO NELLA GESTIONE DEI DATI: IDENTIFICARE E UTILIZZARE LE METRICHE PRINCIPALI PER VALUTARE LA QUALITÀ E L'EFFICACIA DELLE VISUALIZZAZIONI DEI DATI, NONCHÈ PER LA LORO VISUALIZZAZIONE.


CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
1) DISTINGUERE TRA TIPI DI DATI: CAPIRE LE DIFFERENZE TRA DATI CATEGORICI E CONTINUI NUMERI O TEMPORALI E COME QUESTE DIFFERENZE INFLUENZANO L'ANALISI NONCHÈ IL SISTEMA DI GESTIONE.
2) IDENTIFICARE STRUMENTI DI MISURAZIONE DEI DATI: UTILIZZARE STRUMENTI PIÙ IDONEI TRA QUELLI PRESENTATI PER QUANTIFICARE E ANALIZZARE I DATI.
3) VALUTARE CRITICAMENTE LE VISUALIZZAZIONI DEI DATI: SCEGLIERE IN MODO CRITICO LE DIVERSE TECNICHE DI VISUALIZZAZIONE PER RAPPRESENTARE AL MEGLIO I DATI ANALIZZATI, SPIEGARNE CONTENUTI E RELAZIONI CON ALTRE VISTE E VISUALIZZAZIONI SULLO STESSO INSIEME DI DATI.
4) SELEZIONARE OPZIONI DI TRATTAMENTO DEI DATI BASATE SU EVIDENZE: APPLICARE LE MIGLIORI PRATICHE E APPROCCI SUPPORTATI DALLA LETTERATURA TECNICA PER ELABORARE E VISUALIZZARE DATI.

Prerequisiti
SONO RACCOMANDATE CONOSCENZE DI BASE DI LINGUAGGI DI PROGRAMMAZIONE AD ALTO LIVELLO, IN PARTICOLARE PYTHON. È INOLTRE SUGGERITA UNA BUONA CONOSCENZA DELLA LINGUA INGLESE.
Contenuti
1: INTRODUZIONE ALLA GE VISUALIZZAZIONE DEI DATI (3 ORE)

IN QUESTA UNITÀ DIDATTICA, LO STUDENTE ACQUISIRÀ CONOSCENZE SULLA METODOLOGIA IMPIEGATA NELL'INDAGINE, NELL'ORGANIZZAZIONE E NELLA RAPPRESENTAZIONE DEI DATI. SI CONCENTRERÀ SULLA DEFINIZIONE DEL PROBLEMA E SULLE NECESSITÀ CHE DEVONO ESSERE AFFRONTATE PER FORMULARE E RAPPRESENTARE UN PROBLEMA ATTRAVERSO L'USO DEI DATI. INOLTRE, APPRENDERÀ COME TRADURRE QUESTO PROBLEMA IN UN PROCESSO CHE PERMETTA DI SCOPRIRE E GESTIRE UNA RACCOLTA DI DATI RILEVANTI E PERTINENTI AL CONTESTO SPECIFICO DI INTERESSE.

2: DATASPELL, NOTEBOOK JUPYTER E INTEGRAZIONE CON CHATGPT (3 ORE, METÀ DI TEORIA E METÀ DI PRATICA)

IN QUESTA UNITÀ FORMATIVA, LO STUDENTE IMPARERÀ AD UTILIZZARE L'AMBIENTE DI SVILUPPO INTEGRATO DATASPELL SPECIFICAMENTE PER LA PROGRAMMAZIONE IN PYTHON. SI ESPLORERÀ LA CONFIGURAZIONE E LA GESTIONE DI UN AMBIENTE VIRTUALE IN PYTHON, NONCHÉ LA PROCEDURA PER L'INSTALLAZIONE DELLE LIBRERIE PYTHON. INOLTRE, IL CORSO FORNIRÀ COMPETENZE NELL'USO DEI NOTEBOOK JUPYTER, COMPRESA LA VISUALIZZAZIONE INLINE DEI DATI. UN FOCUS PARTICOLARE SARÀ DATO SULL'IMPIEGO DI CHATGPT ALL'INTERNO DI DATASPELL, POTENZIANDO COSÌ L'ANALISI DEI DATI E AMPLIANDO LE CAPACITÀ DI APPRENDIMENTO CON ALTRI STRUMENTI E FUNZIONALITÀ RILEVANTI.

3: IMPORTARE, MODIFICARE ED ESPORTARE I DATI (9 ORE - 3 LEZIONI - METÀ DI TEORIA E METÀ DI PRATICA)

QUESTA UNITÀ DIDATTICA È PROGETTATA PER DOTARE GLI STUDENTI DELLE COMPETENZE NECESSARIE PER IMPORTARE, MANIPOLARE ED ESPORTARE DATI DA UNA VARIETÀ DI FORMATI E SORGENTI IN E DA PYTHON CON DATASPELL. PARTENDO DALL'IMPORTAZIONE DI DATI DA FILE CSV, UN FORMATO STANDARD PER LA MEMORIZZAZIONE DI DATI TABELLARI, PASSEREMO ALL'ESAME DEI FILE MICROSOFT EXCEL. CI IMMERGEREMO ANCHE NELL'IMPORTAZIONE DI DATI DA FILE A LARGHEZZA FISSA, SPESSO INCONTRATI NEL TRATTAMENTO DI DATI LEGACY. L'UNITÀ SI ESTENDERÀ ALL'IMPORTAZIONE DI DATI DA FILE JSON. VERRANNO FORNITI STRUMENTI PER LA CONVERSIONE ED ESPORTAZIONE DEI DATI IN ALTRI FORMATI. UTILIZZO DI PYTHON E DATASPELL PER TABELLE, IMMAGINI. UTILIZZO DI OPENREFINE, BRIDGING CON GOOGLE DRIVE, FACETS, PULIZIA DELLE SORGENTI, IMPORT E EXPORT DI DATI DA CSV A JSON CON LA PIATTAFORMA DI GOOGLE E INTEGRAZIONE CON WIKIPEDIA.


4: GESTIONE DEI DATI CON PANDAS (6 ORE - 2 LEZIONI - METÀ DI TEORIA E METÀ DI PRATICA)

QUESTA UNITÀ DIDATTICA È PROGETTATA PER DOTARE GLI STUDENTI DELLE COMPETENZE NECESSARIE PER UTILIZZARE LA LIBRERIA PANDAS IN PYTHON CON DATASPELL. PARTE DALLA DEFINIZIONE DELLE STRUTTURE PANDAS, AI METODI DI INTERROGAZIONE E STATISTICHE BASIC, GESTIONE DEI MISSING DATA, REIDEXING, ADD/DEL, GESTIONI DEI DUPLICATI, SLICING, CONCATENATE, PANDAS-SQL QUERY. OPERAZIONI COMPLESSE CON PANDAS, METODI DI RAGGRUPPAMENTO, AGGREZIONE E COMBINAZIONE (AGG, FILTER, TRANSFORM). UTILIZZO DELLE FUNZIONE LAMBDA. UTILIZZO DEGLI ARRAY DERIVATI. ESEMPIO SUL DATASE DEI LEGISLATORI STORICI DEL CONGRESSO AMERICANO.

5: INTRODUZIONE ALLA VISUALIZZAZIONE DEI DATI E ALLO STORYTELLING (3 ORE - METÀ DI TEORIA E METÀ DI PRATICA)

QUESTA UNITÀ DIDATTICA È PROGETTATA PER INTRODURRE LO STUDENTE ALLO STORYTELLING VISIVO E SU COME LO STESSO POSSA AUMENTARE SIA LE CAPACITÀ DI ANALISI DEI DATI MA ANCHE DI CREARE CONNESSIONI EMOTIVE E COGNITIVE CON IL PUBBLICO. CASI STUDIO E APPLICAZIONI REALI CHE ILLUSTRANO L'IMPATTO DELLA VISUALIZZAZIONE DEI DATI NELLA COMUNICAZIONE E NEL PROCESSO DECISIONALE. METODOLOGIE E ULTERIORI APPROFONDIMENTI PRATICI NELLA VISUALIZZAZIONE DEI DATI.

6: VISUALIZZAZIONE DEI DATI CON MATPLOTLIB E PANDAS (6 ORE - 2 LEZIONI - METÀ DI TEORIA E METÀ DI PRATICA)
ARCHITETTURA DI MATPLOTLIB, FUNZIONI CORRELATE, UTILIZZO DI MATPLOTLIB CON DATI DERIVATI DA PANDAS. STUDIO, DESCRIZIONE E ANALISI DEI SEGUENTI TIPI DI PLOT: SCATTER PLOTS, BUBBLE PLOTS, LINE CHARTS, MULTIPLE LINE CHARTS, BAR PLOTS, ISTOGRAMMI E DENSITY PLOTS, BOX PLOT E MULTIPLE BOX PLOTS, VIOLIN, PIE AND AREA PLOTS, TREE PLOTS. GESTIONE DEGLI NAS NEI GRAFICI PANDAS, ESEMPIO CON GRAFICO A MATRICE DI DISPERSIONE. CURVE DI ANDREWS, COORDINATE PARALLELE, LAG PLOT, AUTOCORRELATION PLOT, BOOTSTRAP PLOT, RADVIZ PLOT, HEX BIN PLOT, PLOT DI GRAFI. CENNI DI GEOPANDAS. CENNI DI GOOGLE LOOKER STUDIO E KNIME
Metodi Didattici
IL CORSO È COMPOSTO DA LEZIONI TEORICHE (19 ORE) E SESSIONI DI LABORATORIO GUIDATE DAL DOCENTE (11 ORE). LE LEZIONI PERMETTERANNO AGLI STUDENTI DI ACQUISIRE CONOSCENZE SULLA GESTIONE E VISUALIZZAZIONE DEI DATI DA UNA PROSPETTIVA TEORICA E STRATEGICA. DURANTE LE SESSIONI DI LABORATORIO, GLI STUDENTI AVRANNO L'OPPORTUNITÀ DI APPLICARE LE CONOSCENZE ACQUISITE NELLE LEZIONI ATTRAVERSO L'USO DEL LINGUAGGIO DI PROGRAMMAZIONE PYTHON SULLA PIATTAFORMA JETBRAINS DATASPELL / JUPYTER NOTEBOOKS E LE LIBRERIE SPECIFICATE NEL PROGRAMMA DELLE LEZIONI.

IL CORSO PREVEDE IL SUPPORTO PER LO SVILUPPO DI UN ELABORATO INDIVIDUALE E DI UN PROGETTO DI GRUPPO VOLTI ALL'ACQUISIZIONE DELLE COMPETENZE IN GESTIONE E VISUALIZZAZIONE DEI DATI. LO SVILUPPO DELL'ELABORATO/PROGETTO SARÀ DISCUSSO CON LA CLASSE DURANTE IL 20% DELLE ORE DI LABORATORIO E INDIVIDUALMENTE CON GLI STUDENTI DURANTE LE ORE DI RICEVIMENTO CON IL DOCENTE.

LA FREQUENZA SIA ALLE LEZIONI CHE ALLE SESSIONI DI LABORATORIO È OBBLIGATORIA E FORTEMENTE RACCOMANDATA.

L'ACCESSO ALL'ESAME FINALE RICHIEDE LA FREQUENZA DI ALMENO IL 90% DELLE LEZIONI, DELLE SESSIONI DI LABORATORIO E DEGLI ESERCIZI.
Verifica dell'apprendimento
LA VALUTAZIONE DEL CORSO DI GESTIONE E VISUALIZZAZIONE DEI DATI SI SVOLGE IN DUE FASI CONSECUTIVE:

A) UNA PARTE DOVE VIENE PRESENTATO UN PROGETTO DI GESTIONE E VISUALIZZAZIONE DEI DATI A SCELTA DELLO STUDENTE;
B) UN ESAME ORALE CHE RIGUARDA UNA SELEZIONE TRA I 6 ARGOMENTI DISCUSSI DURANTE IL CORSO.

PER CONSIDERARE SUPERATO L'ESAME, IL CANDIDATO DEVE RISPONDERE CORRETTAMENTE ALMENO AL 50% DELLE RICHIESTE
DEL DOCENTE IN ENTRAMBE LE COMPONENTI A E B.

NELL'ESAME PRATICO, GLI STUDENTI DEVONO DIMOSTRARE DI SAPER APPLICARE I METODI APPRESI NEGLI ARGOMENTI DIDATTICI PRESENTATI A LEZIONE. SONO RICHIESTE CAPACITÀ DI COMPRENSIONE DEL DOMINIO APPLICATIVO. PER IL PROGETTO, GLI STUDENTI DEVONO MOSTRARE UNA CONOSCENZA APPROFONDITA DEGLI ARGOMENTI TRATTATI A LEZIONE, DIMOSTRANDO LE COMPETENZE ACQUISITE NELLA GESTIONE E VISUALIZZAZIONE DEI DATI ATTRAVERSO UN PROGETTO CHE RIFLETTA GLI ARGOMENTI DISCUSSI NEL PROGRAMMA DEL CORSO.


IL VOTO FINALE VIENE ATTRIBUITO IN TRENTESIMI, SOMMANDO I PUNTI OTTENUTI NELL'ESAME ORALE (MASSIMO 18 PUNTI) A QUELLI DEL PROGETTO (MASSIMO 18 PUNTI). LA LODE VIENE CONCESSA QUANDO IL CANDIDATO RAGGIUNGE UN PUNTEGGIO MAGGIORE O UGUALE A 31 PUNTI.
Testi
KALILUR RAHMAN - PYTHON DATA VISUALIZATION ESSENTIALS GUIDE.
Altre Informazioni
LA FREQUENZA DELL'INSEGNAMENTO È FORTEMENTE CONSIGLIATA IN QUANTO CONSENTE UNA PIÙ RAPIDA ED EFFICACE COMPRENSIONE DEI FONDAMENTI TEORICI E DELLE TECNICHE APPLICATIVE.
LO STUDENTE DOVRÀ DEDICARE UN ADEGUATO NUMERO DI ORE DI STUDIO, IN AGGIUNTA A QUELLE TRASCORSE IN AULA, PER IL NECESSARIO CONSOLIDAMENTO DELLA PROPRIA CONOSCENZA E PER LO SVILUPPO DELL’ABILITÀ APPLICATIVA DA ACQUISIRE.
AI FINI DELLA VERIFICA DEL PROFITTO, PER LA PROVA ORALE LO STUDENTE DOVRÀ DEDICARE DELLE ORE DI STUDIO AL CONSOLIDAMENTO DELLA PADRONANZA DEI CONCETTI ED ALLA ACQUISIZIONE DI UNA ADEGUATA PROPRIETÀ DI LINGUAGGIO.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-29]