Progetti

Ricerca Progetti

APPRENDIMENTO STATISTICO PER BIG DATA

Nel settore dell'analisi dei dati di tipo Multiview saranno affrontati essenzialmente due applicazioni al campo della Medicina: Bioinformatica e Neuroimaging. Gli approcci perseguibili nella analisi di dati Multiview sono molteplici.: • Riduzione di dimensioni: usando tecniche quali PCA, ICA e CCA • Apprendimento Semi-supervisionato: L'idea è quella di usare pochi dati etichettati cercando di inferire le etichette degli altri da questi(Co-training, Co-EM [6], Bayesian co-training, Robust co-training) • Apprendimento supervisionato: Discriminante di Fisher, combinazione di Kernel . • Clustering: Analisi di dati MultiView senza etichette. Metodi di Matrix factorization e di consenso. Le tecninche di integrazione possibili sono: • Early Integration: • Intermediate Integration: • Late Integration: Un altro approccio molto interessante è quello di utilizzare approcci basati su grafi e reti. Si applicheranno queste tecniche al problema del clusterng e classificazione di pazienti. Lo schema di indagine proposto, basato sulla "Late Integration" consta dei seguenti passi: • Data preprocessing • Feature extraction e ranking • Integrazione Con questi risultati in mano si potrà affrontare il vero problema di data-integration. Riguardo a questo la tecnica più attraente sembra quella delle Random Forest. Queste metodologie saranno utilizzate in congiunzione con algoritmi di classificazione e selezione delle caratteristiche e con algoritmi su grafi per l’integrazione di ulteriori due tipologie di dati multi-vista, quelli relativi al microbioma e quelli relativi all'effetto dei nanomateriali su linee cellulari di vari tessuti animali e umani messi a disposizione dal FIOH di Helsinki all'interno del progetto Europeo FP VII Nanosolutions e di altre collaborazioni internazionali, cui la nostra unità è parte. Un'altra interessante applicazione che si intende portare avanti riguarda la analisi basata su learning multiview su dati risultanti da diversi tipi di imaging neurologico. per esempio le informazioni anatomiche, MRI funzionale e di diffusione costituiscono diverse viste da cui vogliamo estrarre le informazioni riguardanti la composizione dei tessuti cerebrali, la attività funzionale e la connettività anatomica. Pensiamo che anche in questo settore l'applicazione delle tecniche di fusione e federazione delle diverse viste sviluppate porteranno ad una più fondata modellistica di come le diverse aree del cervello si organizzano ed interagiscono funzionalmente nel cervello sano e in quello affetto da particolari disturbi. Infine si inizieranno ad usare tecniche basate su deep learning, ovvero di apprendimento profondo, per l'analisi di tali neuro-immagini.

StrutturaDipartimento di Scienze Aziendali - Management & Innovation Systems/DISA-MIS
Tipo di finanziamentoFondi dell'ateneo
FinanziatoriUniversità  degli Studi di SALERNO
Importo7.918,94 euro
Periodo29 Luglio 2016 - 20 Settembre 2018
Gruppo di RicercaTAGLIAFERRI Roberto (Coordinatore Progetto)
BARDOZZO FRANCESCO (Ricercatore)
CIAPARRONE GIOELE (Ricercatore)
GALDI PAOLA (Ricercatore)
PUGLIA LUCA (Ricercatore)
RAICONI Giancarlo (Ricercatore)
SERRA ANGELA (Ricercatore)
VITALE LUCA (Ricercatore)