Giuseppe FENZA | INFORMATION SYSTEMS FOR BIG DATA
Giuseppe FENZA INFORMATION SYSTEMS FOR BIG DATA
cod. 0222800009
INFORMATION SYSTEMS FOR BIG DATA
0222800009 | |
DIPARTIMENTO DI SCIENZE AZIENDALI - MANAGEMENT & INNOVATION SYSTEMS | |
CORSO DI LAUREA MAGISTRALE | |
DATA SCIENCE E GESTIONE DELL'INNOVAZIONE | |
2024/2025 |
OBBLIGATORIO | |
ANNO CORSO 2 | |
ANNO ORDINAMENTO 2022 | |
PRIMO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | |
---|---|---|---|---|
INF/01 | 3 | 21 | LEZIONE | |
INF/01 | 3 | 21 | LABORATORIO |
Appello | Data | Sessione | |
---|---|---|---|
FENZA | 09/12/2024 - 14:30 | SESSIONE ORDINARIA | |
FENZA | 09/12/2024 - 14:30 | SESSIONE DI RECUPERO |
Obiettivi | |
---|---|
IL CORSO HA L’OBIETTIVO DI INTRODURRE I CONCETTI FONDAMENTALI, LE TECNOLOGIE E LE ARCHITETTURE DI RIFERIMENTO, NONCHÉ I REQUISITI, PER LA PROGETTAZIONE E LA REALIZZAZIONE DI SISTEMI INFORMATIVI ORIENTATI AI BIG DATA. LA CONOSCENZA E LA CAPACITÀ DI COMPRENSIONE SI SVILUPPERANNO PRINCIPALMENTE MEDIANTE LO STUDIO DI ALCUNI DEI FRAMEWORK TECNOLOGICI PIÙ RILEVANTI NEL CONTESTO DEI BIG DATA, QUALI: HADOOP, SPARK, SPARK STREAMING, KAFKA, STORM, ETC. INOLTRE, SI STUDIERANNO TECNOLOGIE DI MEMORIZZAZIONE BASATE SU NOSQL (MONGODB, NEO4J, ETC.), FORMATI DI FILE PER BIG DATA (AVRO, PARQUET, ETC.), E SARANNO FORNITI CENNI INTRODUTTIVI ALLA VISUALIZZAZIONE DATI MEDIANTE STACK TECNOLOGICI, QUALI: APACHE SOLR+BANANA, ELASTICSEARCH+KIBANA, ETC. IN PARTICOLARE, TALI FRAMEWORK SARANNO SPERIMENTATI NELL’AMBITO DI ATTIVITÀ PROGETTUALI PER IMPLEMENTARE IN MODO SCALABILE LE FASI DI: ACQUISIZIONE, MEMORIZZAZIONE ED ELABORAZIONE DISTRIBUITA, SIA IN MODALITÀ BATCH CHE STREAM, PER IL CALCOLO DI ANALITICHE DEDUCIBILI DA RISORSE NON STRUTTURATE, O SEMI-STRUTTURATE. ALLA FINE DEL CORSO, LO STUDENTE SARÀ IN GRADO DI SELEZIONARE ED UTILIZZARE I FRAMEWORK PIÙ APPROPRIATI PER REALIZZARE UN INFORMATION SYSTEM ORIENTATO AI BIG DATA. LO STUDENTE SARÀ INCORAGGIATO A SVOLGERE LAVORO DI GRUPPO IN CUI SARANNO APPLICATE LE CONOSCENZE ACQUISITE PER L’IMPLEMENTAZIONE DI UN PROGETTO CHE ESIBISCA FUNZIONALITÀ DI BIG DATA ANALYTICS IN UN AMBITO A SCELTA TRA: OPEN SOURCE INTELLIGENCE, MISINFORMATION E FAKE NEWS, SMART ENVIRONMENT, ETC. IN QUESTO MODO SI ESERCITERÀ LA CAPACITÀ DI SELEZIONARE E ADOTTARE SCELTE TECNOLOGICHE IN DIPENDENZA DI ESIGENZE ETEROGENEE DERIVATE DAL CONTESTO DI PROGETTO. |
Prerequisiti | |
---|---|
È AUSPICABILE CHE GLI STUDENTI CONOSCANO: I CONCETTI RELATIVI AGLI ALGORITMI E ALLE STRUTTURE DATI FONDAMENTALI; UNO DEI LINGUAGGI DI PROGRAMMAZIONE TRA JAVA, PYTHON, SCALA PER SCRIVERE PROGRAMMI ATTI A RISOLVERE SEMPLICI PROBLEMI; I FONDAMENTI DELLE BASI DI DATI E DEL LINGUAGGIO SQL. |
Contenuti | |
---|---|
DOPO UNA BREVE INTRODUZIONE AI PRINCIPALI OBIETTIVI FORMATIVI DEL CORSO, GLI STUDENTI SARANNO INTRODOTTI AL MONDO DEI BIGDATA. SIN DAI MOMENTI INIZIALI DEL CORSO GLI STUDENTI SARANNO INCORAGGIATI A LAVORARE IN GRUPPO ALLA DEFINIZIONE DI UN PROGETTO CHE REALIZZERANNO APPLICANDO LE CONOSCENZE ACQUISITE SEGUENDO UN APPROCCIO STEP-BY-STEP. PERTANTO, IL CORSO SARÀ ARTICOLATO NELLE SEGUENTI PARTI PRINCIPALI. (4 ORE) INTRODUZIONE AI BIGDATA ED ALLE ARCHITETTURE BIGDATA ENABLED PANORAMICA SUI BIGDATA REQUISITI BIGDATA INFORMATION SYSTEM ARCHITETTURA LAMBDA E KAPPA (4 ORE DI CUI 1 DI LABORATORIO) ACQUISIZIONE FORMATI DI SCAMBIO E SERIALIZZAZIONE DATI: CSV, JSON, AVRO, PARQUET, ETC. REST E STREAM API PER L’ACCESSO A SORGENTI DATI, QUALI: TWITTER, DROPBOX, ETC. (10 ORE DI CUI 7 DI LABORATORIO) ELABORAZIONE ED ANALISI DISTRIBUITA DEI BIG DATA HADOOP E TECNOLOGIE AD ESSO RELATE. SPARK, E ALTRI ENGINE DI ELABORAZIONE DISTRIBUITA. ESERCITAZIONI CON SPARK DATAFRAME ESERCITAZIONI CON SPARK MACHINE LEARNING (10 ORE DI CUI 7 DI LABORATORIO) STORAGE NOSQL DB, QUALI KEY-VALUE STORE, DOCUMENT-ORIENTED DATABASE, COLUMN-ORIENTED E GRAPH DB. ESERCITAZIONI CON MONGODB ESERCITAZIONI CON NEO4J (10 ORE DI CUI 4 DI LABORATORIO) DISTRIBUTED STREAM PROCESSING INTRODUZIONE ALL’ELABORAZIONE DISTRIBUITA DI STREAM DI DATI. APACHE STORM ESERCITAZIONI CON SPARK STREAMING ESERCITAZIONI CON KAFKA STREAMING (4 ORE DI CUI 2 DI LABORATORIO) BIG DATA ANALYTICS INTRODUZIONE ALLA REALIZZAZIONE DI DASHBOARD PER LA VISUALIZZAZIONE DI ANALYTICS MEDIANTE APPLICAZIONI WEB, INCLUDENDO D3.JS E GLI STACK TECNOLOGICI PIÙ UTILIZZATI, QUALI: APACHE SOLR E BANANA, ELASTICSEARCH E KIBANA ESERCITAZIONI CON APACHE SOLR E BANANA |
Metodi Didattici | |
---|---|
IL CORSO SI PROPONE DI SPRONARE GLI STUDENTI AL PROCESSO DI FORMAZIONE PERMANENTE, CHE COMPORTA L’AGGIORNAMENTO CONTINUO (PER TUTTA LA VITA) DELLE CONOSCENZE E DELLE COMPETENZE, CERCANDO DI STIMOLARE LO SPIRITO CRITICO IN MERITO ALLE NUOVE TECNOLOGIE EMERGENTI NELL’AMBITO DI RIFERIMENTO. AL FINE DI ABITUARLI ALL'AUTO-APPRENDIMENTO, GLI STUDENTI SARANNO INVITATI AD APPROFONDIRE GLI ARGOMENTI DEL CORSO PROPONENDO LORO L’ACCESSO A RISORSE ONLINE DI PARTICOLARE INTERESSE. DURANTE IL CORSO IL DOCENTE FARÀ UN AMPIO USO DI ESEMPI, ESERCITAZIONI GUIDATE. DA UN PUNTO DI VISTA STRUTTURALE, LE LEZIONI CONSISTERANNO IN: (21 ORE) LEZIONI FRONTALI. (21 ORE) LABORATORIO. LA FREQUENZA ALLE LEZIONI NON È OBBLIGATORIA MA È FORTEMENTE CONSIGLIATA. |
Verifica dell'apprendimento | |
---|---|
IL RAGGIUNGIMENTO DEGLI OBIETTIVI DELL’INSEGNAMENTO È CERTIFICATO MEDIANTE IL SUPERAMENTO DI UN ESAME CON VALUTAZIONE IN TRENTESIMI, SUDDIVISO IN DUE PARTI: UNA PROVA TEORICA E UN PROGETTO PRATICO, CIASCUNO CON UNA SOGLIA MINIMA DI SUFFICIENZA. PROVA TEORICA: CONSISTE IN UN'ESPOSIZIONE ORALE DI CIRCA 40 MINUTI, DURANTE LA QUALE LO STUDENTE PRESENTERÀ UN ARGOMENTO DI INTERESSE TECNOLOGICO, METODOLOGICO E/O APPLICATIVO DEL CORSO. LA PRESENTAZIONE DEVE ESSERE SUPPORTATA DA UNA RICERCA INDIVIDUALE CHE METTA IN RELAZIONE I TEMI TRATTATI DURANTE LE LEZIONI. LA VALUTAZIONE DELLA PROVA ORALE TIENE CONTO DELLA CAPACITÀ ESPOSITIVA, DELLA CONOSCENZA DEGLI ARGOMENTI DEL CORSO E DELL’ANALISI CRITICA. PROGETTO PRATICO: IL PROGETTO PUÒ ESSERE SVOLTO INDIVIDUALMENTE O IN GRUPPO E DEVE ESSERE CONSEGNATO PRIMA DELL’ESAME ORALE. DEVE INCLUDERE TUTTE LE FASI DI UNA TIPICA PIPELINE DI ANALISI DEI DATI: ACQUISIZIONE, MEMORIZZAZIONE, ELABORAZIONE E VISUALIZZAZIONE. LA DOCUMENTAZIONE DEL PROGETTO DI GRUPPO DEVE SPECIFICARE IL CONTRIBUTO DI CIASCUN MEMBRO. LA VALUTAZIONE SI BASA SULLA VALIDITÀ TECNICA DELLE SCELTE EFFETTUATE, SULLA PERTINENZA DEL FLUSSO DI ANALISI ADOTTATO E SULLA CHIAREZZA ESPOSITIVA DELLE ANALISI SVOLTE. IL VOTO FINALE È LA MEDIA DEI VOTI DELLE DUE PROVE, ESPRESSO IN TRENTESIMI, CON POSSIBILITÀ DI LODE. LA LODE È ASSEGNATA SE IL CANDIDATO DIMOSTRA PADRONANZA DEI CONTENUTI TEORICI E OPERATIVI, CON CAPACITÀ DI PRESENTAZIONE E ELABORAZIONE AUTONOMA ANCHE IN CONTESTI DIVERSI DA QUELLI PROPOSTI DAL DOCENTE. IL MINIMO PUNTEGGIO PER SUPERARE L’ESAME È 18/30, ATTRIBUITO IN CASO DI INCERTEZZE SIGNIFICATIVE NELL’USO DELLA TERMINOLOGIA E DEI CONCETTI STUDIATI, E UN USO INAPPROPRIATO DEGLI STRUMENTI NEL PROGETTO. IL MASSIMO PUNTEGGIO, 30/30, È ASSEGNATO QUANDO LO STUDENTE MOSTRA UNA CONOSCENZA COMPLETA E CAPACITÀ OPERATIVA NELL’ATTIVITÀ PROGETTUALE SVOLTA. |
Testi | |
---|---|
MARZ, N., & WARREN, J. (2015). BIG DATA: PRINCIPLES AND BEST PRACTICES OF SCALABLE REAL-TIME DATA SYSTEMS. NEW YORK; MANNING PUBLICATIONS CO. LIBRI SUGGERITI: BAHGA, ARSHDEEP, AND VIJAY MADISETTI. BIG DATA SCIENCE & ANALYTICS: A HANDS-ON APPROACH. VPT, 2016. |
Altre Informazioni | |
---|---|
SARANNO FORNITI LINK A MATERIALE DISPONIBILE ONLINE E MATERIALE DIDATTICO USATO A LEZIONE. |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-18]