Progetti

Vittorio FUCCELLA Progetti

ACQUISIZIONE, ELABORAZIONE E ANALISI DI BIG DATA E TECNOLOGIE CONNESSE.

I dataset analizzati nel dominio dei “Big Data” presentano dimensioni e complessità tali da richiedere strumenti più avanzati rispetto a quelli tradizionali. Verranno studiate tecniche visuali ed interattive per l' analisi di relazioni tra i dati. Le tecniche sono mirate ad effettuare operazioni di esplorazione dei dati in modo intuitivo e si avvarranno di paradigmi gestuali, particolarmente indicati per dispositivi con touch-screen. Fra le possibili applicazioni di analisi e visualizzazione dei dati verrà preso in considerazione anche l'ambito web e in particolare il calcolo della reputazione online per migliorare la qualità delle interazioni tra utenti. Nel campo medico/biologico il contesto "Big Data" è caratterizzato dalla presenza di "federazioni di dati" provenienti da fonti eterogenee. Situazione che suggerisce di collegare i dati dei singoli pazienti a un'istanza di dati strutturato con più rappresentazioni separate in spazi diversi,e ci permette di trattare la rispettivi spazi come diverse "viste" della stessa istanza di dati. In tal modo, ogni modello di dati che coinvolgono due o più visualizzazioni degli stessi istanze dei dati sarà istituito definito e trattato come "multi-view".Nell'ambito del progetto di ricerca ci si concentrerà sui metodi di apprendimento statistico per estrarre tali significative strutture dei dati dal coacervo dei dati ottenibili in una situazione "multi view" l'ambito applicativo sarà quello delle neuroscienze in cui si hanno dati provenienti da neuroimaging, anatomici, funzionali, MRI (aMRI, fMRI, dMRI) oltre ai dati di tipo medico/biologico classici come quelli clinici, Geni, MiRNA o altri dati -omici.Multi-view modelli provengono da viste multiple indipendenti dello stesso oggetto, corrispondenti, ad esempio, alle misurazioni indipendenti in diverse esperienze e diversi domini fisici. Poiché questi oggetti rappresentano punti di dati in spazi diversi, (dis) concetti di somiglianza generalmente seguire le regole e definizioni diverse in ogni singola visualizzazione. La problematica è quella di integrazione e clustering di dati multi vista ai fini di individuare particolari "signatures" caratterizzanti particolari malattie cerebrali.Ci sono fondamentalmente due strategie alternative per l'integrazione di dati provenienti da diverse visualizzazioni delle stessi istanze. In una strategia, le caratteristiche delle diverse viste vengono utilizzate per generare rappresentazioni multidimensionali dei dati prima di iniziare la ricerca vera e propria per i modelli, questo approccio è noto come Early-Integration di dati multi view. Un'altra strategia prevede prima la ricerca di modelli all'interno di una singola vista e poi la integrazione dei modelli di tutte le viste. Questo approccio è "late multi-view integration". Verranno confrontati entrambi gli approcci ance se da una prima analisi sembra che la "late integration" perché questo tipo di soluzioni generalizza più naturale ad un approccio multi-livello multi-view. Integrazione dove i livelli corrispondono a differenti domini corrispondenti a fonti omogenee di informazioni, e di viste multiple provenienti dallo stesso dominio.La problematica "Big Data" richiede grandi risorse dal punto di vista computazionale, la soluzione fino ad ora è sempre stata trovata nel campo del calcolo HPC tradizionale dai grossi cluster al supercomputing, tali approcci si stanno rivelando sempre meno sostenibili a causa dell'elevato impatto energetico e ambientale che comportano. Da diversi anni il gruppo di ricerca si sta muovendo sulla ricerca soluzioni alternative, basate sul co-disegno hardware/software in questo modo grazie alla introduzione di coprocessori hardware si riesce ad ottenere prestazioni elevate con frazioni irrisorie della energia richiesta da soluzioni tradizionali. Si continuerà su questa linea in particolare per quello che riguarda la genomica e i problemi di ricerca visuale i 3 dimensioni.

StrutturaDipartimento di Ingegneria dell'Informazione ed Elettrica e Matematica applicata/DIEM
Tipo di finanziamentoFondi dell'ateneo
FinanziatoriUniversità  degli Studi di SALERNO
Importo11.585,45 euro
Periodo7 Novembre 2014 - 6 Novembre 2016
Proroga6 novembre 2017
Gruppo di RicercaRAICONI Giancarlo (Coordinatore Progetto)
COSTAGLIOLA Gennaro (Ricercatore)
DE ROSA Mattia (Ricercatore)
FUCCELLA Vittorio (Ricercatore)
GALDI PAOLA (Ricercatore)
MONTECUOLLO FERDINANDO (Ricercatore)
PASCUCCIO FERNANDO ANTONIO (Ricercatore)
PUGLIA LUCA (Ricercatore)
RAVANO LORENZO (Ricercatore)
SERRA ANGELA (Ricercatore)
TAGLIAFERRI Roberto (Ricercatore)
VIGLIAR MARIO (Ricercatore)