METODI E TECNICHE PER LA DATA SCIENCE

Giuseppe POLESE METODI E TECNICHE PER LA DATA SCIENCE

0522500085
DIPARTIMENTO DI INFORMATICA
CORSO DI LAUREA MAGISTRALE
INFORMATICA
2016/2017

OBBLIGATORIO
ANNO CORSO 2
ANNO ORDINAMENTO 2015
SECONDO SEMESTRE
CFUOREATTIVITÀ
972LEZIONE
Obiettivi
INTEGRARE CONOSCENZE ACQUISITE NELL’AMBITO DI ALTRI INSEGNAMENTI SULLE BASI DI DATI CON COMPETENZE UTILI ALLO SVOLGIMENTO DELLA PROFESSIONE DEL DATA SCIENTIST.

CONOSCENZA E CAPACITÀ DI COMPRENSIONE:

• MODELLI E TECNOLOGIE PER LA GESTIONE DI GRANDI BASI DI DATI, EVENTUALMENTE DISTRIBUITE
• ESTRAZIONE DAI DATI E PRESENTAZIONE VISUALE DI CONOSCENZA UTILE PER I PROCESSI DECISIONALI DI VARI TIPI DI ORGANIZZAZIONI.


CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE:

• SAPER ACQUISIRE, ORGANIZZARE, GESTIRE ED ELABORARE GRANDI VOLUMI DI DATI
• SAPER ESTRARRE CONOSCENZA DAI DATI
• SAPER COMUNICARE LA CONOSCENZA ESTRATTA DAI DATI ATTRAVERSO DIVERSE FORME DI RAPPRESENTAZIONE, INCLUSO TECNICHE VISUALI
Prerequisiti
LO STUDENTE DEVE AVER SUPERATO L’ESAME DEL CORSO DI BASI DI DATI 2 E CONOSCERE I FONDAMENTI DI:
• INGEGNERIA DEL SOFTWARE
• PARADIGMA AD OGGETTI
• RETI E SISTEMI DISTRIBUITI.
Contenuti
DATA QUALITY:
DIPENDENZE FUNZIONALI APPROSSIMATE E LORO UTILIZZO NEL DATA QUALITY
INTEGRAZIONE DATI DA SORGENTI MULTIPLE
DATA CLEANSING

BIG DATA:
PROBLEMATICHE DI BIG DATA
TECNOLOGIE DI SUPPORTO AI BIG DATA
MAP-REDUCE

BUSINESS INTELLIGENCE:
SISTEMI DI SUPPORTO ALLE DECISIONI
KNOWLEDGE DISCOVERY DAI DATI
ONLINE ANALYTICAL PROCESSING
CENNI SUL TEXT MINING

MACHINE LEARNING:
FORME DI APPRENDIMENTO
ALBERI DI DECISIONE
FORMULAZIONE LOGICA DELL’APPRENDIMENTO
APPRENDIMENTO BASATO SU SPIEGAZIONI
PROGRAMMAZIONE LOGICA INDUTTIVA
APPRENDIMENTO STATISTICO
APPRENDIMENTO CON VARIABILI NASCOSTE
APPRENDIMENTO BASATO SULLE ISTANZE
RETI NEURALI
MACHINE KERNEL
APPRENDIMENTO PER RINFORZO

VISUAL DATA ANALYTICS:
TECNICHE DI RAPPRESENTAZIONE VISUALE
MANIPOLAZIONE VISUALE DEI RISULTATI
VISUAL DATA MINING

INFORMATION RETRIEVAL:
VALUTAZIONE DI SISTEMI IR
PRESENTAZIONE DEI RISULTATI
IMPLEMENTAZIONE DI UN SISTEMA IR

TEMATICHE EMERGENTI:
ORGANIZZAZIONE NOSQL DEI DATI E MODELLO CHIAVE-VALORE
DATA PRIVACY
CENNI SULL’ANALISI DELLE RETI SOCIALI
Metodi Didattici
LEZIONI FRONTALI E SEMINARI PER LA PRESENTAZIONE DEI CONCETTI E LO SVILUPPO DI CAPACITÀ DI PROGETTARE E IMPLEMENTARE SOLUZIONI PER PROBLEMATICHE DI DATA SCIENCE.
Verifica dell'apprendimento
LO STUDENTE DEVE SVILUPPARE UN PROGETTO RIGUARDANTE UNO DEGLI ARGOMENTI TRATTATI NELL’INSEGNAMENTO, PER POI SOSTENERE UNA PROVA ORALE
Testi
S.J.RUSSELL, P. NORVIG, INTELLIGENZA ARTIFICIALE. UN APPROCCIO MODERNO, VOLUME 2 (2/ED, 2005), PEARSON EDUCATION ITALIA.

C.M. BISHOP: “PATTERN RECOGNITION AND MACHINE LEARNING”, SPRINGER SCIENCE, NEW YORK, 2006.

R.A. ELMASRI, S.B. NAVATHE, “FUNDAMENTALS OF DATABASE SYSTEMS”, 6A EDIZIONE, ADDISON WESLEY, 2010.

GOLFARELLI M., RIZZI S., “DATA WAREHOUSE - TEORIA E PRATICA DELLA PROGETTAZIONE”, THE MCGRAW-HILL COMPANIES, 2006.
Altre Informazioni
LA FREQUENZA DELLE LEZIONI È FORTEMENTE CONSIGLIATA. GLI STUDENTI DEVONO ESSERE PREPARATI A TRASCORRERE UNA CONGRUA QUANTITÀ DI TEMPO NELLO STUDIO AL DI FUORI DELLE LEZIONI, ALLO SCOPO DI APPROFONDIRE MEGLIO LE TEMATICHE AFFRONTATE IN CLASSE E DI SVILUPPARE IL PROGETTO DEL CORSO.
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2019-03-11]