DATA SCIENCE

Domenico PARENTE DATA SCIENCE

0222600021
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS
CORSO DI LAUREA MAGISTRALE
BUSINESS INNOVATION AND INFORMATICS - BUSINESS, INNOVAZIONE ED INFORMATICA
2019/2020

OBBLIGATORIO
ANNO CORSO 2
ANNO ORDINAMENTO 2016
PRIMO SEMESTRE
CFUOREATTIVITÀ
1060LEZIONE
Obiettivi
IL PERCORSO FORMATIVO (60 ORE E 10 ECTS) SI PROPONE DI FAR ACQUISIRE AGLI STUDENTI UNA DOTAZIONE DI CONOSCENZE RELATIVE ALL’ANALISI DI DATI ETROGENEI, PER CONSENTIRE UNA GESTIONE SCALABILE CON COMPLESSI SISTEMI. IL CORSO SI PROPONE, INFATTI, DI SVILUPPARE CAPACITÀ ANALITICHE ORIENTATE ALLA RISOLUZIONE DI PROBLEMI COMPLESSI E ARTICOLATI CHE RICHIEDONO SOLUZIONI IBRIDE NELLA GESTIONE DI DATI ATTRAVERSO APPROCCI DI DATA MINING, CON TECNICHE DISTRIBUITE, CON PARADIGMIDI COMPUTAZIONE AVANZATI, FINALIZZATE AL DISCOVERY DATA-DRIVEN E ALLA PREDIZIONE.

LO STUDENTE, AL TERMINE DEL PERCORSO FORMATIVO, AVRÀ ACQUISITO CONOSCENZE TEORICHE E CAPACITÀ PRATICHE DI DATA ANALYTICS (PER LA RISOLUZIONE DI PROBLEMI DERIVANTI DALL’ACQUISIZIONE E GESTIONE DI GRANDI MOLI DI DATI), NONCHÉ CAPACITÀ DI UTILIZZO DELLE PRINCIPALI TECNICHE E DEGLI STRUMENTI UTILI ALLA RISOLUZIONE DI TALUNE PROBLEMATICHE SPECIFICHE.

LO STUDENTE SARÀ STIMOLATO ALLO SVILUPPO DI CAPACITÀ DI ANALISI E DESCRIZIONE/ESTRAZIONE DELLE CARATTERISTICHE INSITE NEI DATI, E L’ABILITÀ DI FORNIRE UN MODELLO ASTRATTO CHE EVIDENZI LE PECULIARITÀ RILEVATE DALL’ELABORAZIONE DEI DATI STESSI.

IL CORSO MIRA A SVILUPPARE COMPETENZE SUL DATA COLLECTION E FAVORIRE LO SVILUPPO DI CAPACITÀ DI ANALISI CRITICA, ATTRAVERSO UN APPROCCIO IBRIDO PER DEFINIRE UNA STRATEGIA COMPLESSIVA VOLTA A TRASFORMARE I DATI IN INFORMAZIONI UTILI.
Prerequisiti
NOZIONI DI BASE RELATIVI ALLA GESTIONE DI ARCHIVI DI DATI (DATA BASE)
Contenuti
OBIETTIVO DEL CORSO È, IN GENERALE, FORNIRE UNA PREPARAZIONE SOLIDA E MODERNA ALLA COMPRENSIONE E GESTIONE DELLE VARIE PROSPETTIVE E SFUMATURE CHE INTERVENGONO NELL'ANALISI COMPLETA DEI DATI.
I CONTENUTI INCLUDONO: VISUALIZZAZIONE DEI DATI E PROVENANCE; LA MANIPOLAZIONE E ANALISI DEI DATI; APPROCCI METODOLOGICI E FORMALI AL DATA ANALYTICS; MODELLAZIONE E ASTRAZIONE ATTRAVERSO I LINGUAGGI ONTOLOGICI, NELL’AMBITO DEL SEMANTIC WEB.
IL CORSO È RIPARTITO IN DUE PARTI:
1 PARTE
- LEZIONE INTRODUTTIVA SUL DATA SCIENCE, IL SUO IMPIEGO E IL RUOLO NEI DIVERSI AMBITI APPLICATIVI (2H).

-ANALISI DEI DATI, DATA VISUALIZATION (2H)
-TECNICHE STATISTICHE DI BASE PER LA DESCRIZIONE E ANALISI DI DATI (4H) .
-PRINCIPALI ALGORITMI UNSUPERVISED, SUPERVISED E PREDITTIVI PER ANALIZZARE E MANIPOLARE I DATI (6H),
BACKGROUND SUL LE LIBRERIE PYTHON PER IL DATA MANIPULATION (2H).
- STUDIO DI TECNICHE AVANZATE PER LA MODELLAZIONE E ASTRAZIONE DEI DATI GREZZI: L’INFORMAZIONE CHE DERIVA DAI DATI STESSI È ELABORATA ATTRAVERSO “STRATEGIE E METODI PER IDENTIFICARE, RACCOGLIERE, SVILUPPARE, CONSERVARE E RENDERE ACCESSIBILE LA CONOSCENZA” GRAZIE A STRUMENTI EVOLUTI DELL’INFORMATION TECNOLOGY (2H).
- METODOLOGIA PER LA FORMALIZZAZIONE ESPLICITA DELLA CONOSCENZA ATTRAVERSO TECNICHE E LINGUAGGI ONTOLOGY-DRIVEN (2H).
- LE TECNOLOGIE SEMANTICHE: RDF, RDF-S (2H),
- LE TECNOLOGIE SEMANTICHE: OWL (2H)
- LINGUAGGI ONTOLOGICI NOTI IN AMBITI APPLICATIVI COME SKOS E FOAF (2H),
-APPLICAZIONI IN DOMINI: TEXT MINING (2H)
- NATURAL LANGUAGE PROCESSING (2H).

LA SECONDA PARTE
INTRODUZIONE AL DATA MINING (3H)
SIMILARITÀ (3H)
MINING DATA STREAMS (4H)
FREQUENT ITEMSET (4H)
CLUSTERING(4H)
ADVERTISING ON THE WEB (4H)
RECOMMENDATION SYSTEMS (4H)
LARGE-SCALE MACHINE LEARNING (4H)




Metodi Didattici
IL CORSO PREVEDE LEZIONI FRONTALI IN AULE ED ESERCITAZIONI PRATICHE SUGLI ARGOMENTI TRATTATI IN CLASSE.
Verifica dell'apprendimento
IL CORSO PREVEDE UNA PROVA SCRITTA E UNA PROVA ORALE.



Testi
HAN, KAMBER, PEI, "DATA MINING, CONCEPT AND TECHNIQUES"
J. LESKOVEC, A. RAJARAMAN, J.D. ULLMAN, "MINING OF MASSIVE DATASETS", 2ND ED., CAMBRIDGE UNIVERSITY PRESS.
Altre Informazioni
SLIDES E DISPENSE FORNITE DAL DOCENTE

  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2021-02-19]