Francesco ORCIUOLI | Progetti
Francesco ORCIUOLI Progetti
DATA STREAMS MINING AND PROCESSING: METHODOLOGIES, ARCHITECTURES, AND APPLICATIONS
La proposta si focalizza sulle sfide emergenti relativamente alla definizione di metodologie, architetture e algoritmi per supportare l’elaborazione di “data stream”. Infatti, la disponibilità di dati massivi, eterogenei e inclusi in flussi di dati “live” evidenzia l’esigenza di elaborare analisi e ricerche in real-time mediante l’uso di algoritmi di machine-learning online ed adattivi. L’elaborazione di data stream con elevato “rate” stressa le capacità degli algoritmi di data mining tradizionali per la scoperta di pattern nascosti, correlazioni non note, e così via. Inoltre, la disponibilità della dimensione temporale, se da un lato, complica lo scenario sia architetturale che metodologico offre, dall’altro, nuove opportunità applicative in termini di scoperta di pattern ricorrenti utili, ad esempio, a profilare più adeguatamente le utenze, nonché, ad eseguire previsioni più robuste. Le architetture e le metodologie per l’elaborazione di data stream devono ottimizzare l’uso della memoria e confrontarsi con le problematiche di evoluzione dei dati che obbligano a progettare modelli di risposta adattivi in grado di adeguarsi all’evolvere del contesto (drift-aware). Infine, l’usabilità di tali metodologie dovrà misurarsi con l’esigenza di visualizzare, riassumere ed evidenziare analitiche desunte dai dati in movimento per poter offrire un efficace strumento a supporto del decision making sia in situazioni critiche che all’implementazione di strategie manageriali, marketing, etc.La proposta prevede l’esecuzione delle seguenti attività di ricerca:- Studio, analisi, definizione e sperimentazione di algoritmi di machine-learning online e adattivi operanti su data stream provenienti da diversi domini, quali: social media (Twitter, Facebook, etc.), ambienti smart, etc.;- Studio, analisi e sperimentazione di metodologie time-aware per la scoperta di pattern ricorrenti, ad esempio: in ambito social media per il mining di modelli utili a supportare il ranking, il retrieval, e così via; oppure, in ambienti smart, per monitorare e rilevare eventi, come frodi su reti elettriche, etc. - Studio, analisi e sperimentazione di tecniche di visualizzazione di analitiche desunte dai dati in movimento per poter offrire un efficace strumento a supporto del decision making sia in situazioni critiche che per l’implementazione di strategie manageriali, di marketing, etc.;- Studio e analisi di machine learning unsupervised mediante approcci che integrano l’uso di tecniche di deep learning (Restricted and Deep Boltzman Machine, Deep Belief Network, etc.) con approcci knowledge-based a vantaggio dell’interpretabilità del modello appreso;- Studio, analisi e definizione di metodi e tecniche per la “concettualizzazione” basata su approcci semantici e l’estrazione di relazioni temporali (e non) da stream di dati. In questo ambito si investigheranno maggiormente le evoluzioni della Formal Concept Analysis (FCA) come, ad esempio, la Temporal Concept Analysis (TCA);- Studio, analisi e definizione di framework per il supporto al Group Decision Making nell’ambito di processi critici. In questa attività si farà particolare riferimento al Fuzzy Consensus Model e alle sue varianti;Dal punto di vista applicativo, si focalizzerà maggiormente l’attenzione su: social media e smart environment. Il progetto prevede di sperimentare, validare e valutare i risultati ottenuti in diversi scenari reali e di forte interesse per il gruppo di ricerca, spaziando dalle analisi su smart grid per il rilevamento di frodi al ranking, filtering e controllo delle informazioni condivise su social media, ad esempio, per il controllo della diffusione di misinformation. Dal punto di vista tecnologico saranno impiegate principalmente tecnologie open source per l’acquisizione, lo storage, la manutenzione, l’elaborazione dei data stream, quali: Apache Kafka, Apache Storm, Spark e Spark Streaming, Hadoop, NoSQL DB; e per l’apprendimento DeepLearning4J, Keras, Theano, TensorFlow, etc.
Struttura | Dipartimento di Scienze Aziendali - Management & Innovation Systems/DISA-MIS | |
Responsabile | FENZA Giuseppe | |
Tipo di finanziamento | Fondi dell'ateneo | |
Finanziatori | Università degli Studi di SALERNO | |
Importo | 5.890,87 euro | |
Periodo | 20 Novembre 2017 - 20 Novembre 2020 | |
Proroga | 20 febbraio 2021 | |
Gruppo di Ricerca | FENZA Giuseppe (Coordinatore Progetto) CALIFANO FRANCESCO (Ricercatore) DRIOUICH YOUSSEF (Ricercatore) IANNOTTA ERENNIO (Ricercatore) MARINO DOMENICO (Ricercatore) ORCIUOLI Francesco (Ricercatore) PARENTE Domenico (Ricercatore) RUGGIERO MARIO (Ricercatore) Volpe Alberto (Ricercatore) |