Projects

Research Projects

METODI STATISTICI COMPUTER-INTENSIVE PER LA CLASSIFICAZIONE DI SERIE STORICHE ECONOMICHE E FINANZIARIE

Il progetto innanzitutto si pone come obiettivo la rassegna critica degli algoritmi di cluster esistenti per dati dipendenti, con l'obiettivo di analizzare pregi e difetti degli algoritmi "raw data based", di quelli "feature based" e di quelli "model based" con particolare riferimento alla loro efficienza computazionale ed alla loro scalabilità quando si considerano data sets ad elevata dimensionalità. Un focus particolare sarà dato sull'analisi delle performance di queste tecniche nel caso di dati a bassa frequenza (tipico di serie di tipo macroeconomico) e nel caso di dati ad alta frequenza (tipico delle serie finanziarie).Sulla base dell'analisi critica verranno proposte tecniche statistiche innovative che siano efficienti sul piano computazionale, che risultino facilmente scalabili su insiemi di dati ad elevata dimensionalità, che siano robuste in presenza di valori anomali e che tengano conto di eventuali problemi di "data mining" e "data snooping". Una particolare attenzione verrà prestata a serie storiche di dati generati da ranking che nella letteratura più recente hanno suscitato un elevato interesse fra gli studiosi di serie storiche, anche per il notevole impatto e la notevole diffusione che hanno questo tipo di dati anche in ambito extra-economico. In questo ultimo caso, e nel caso di procedure di classificazione "feature based", si farà riferimento a modelli stocastici del tipo "conditional random fields" che permettono una efficace modellizzazione probabilistica di dati non continui e fortemente correlati.Le tecniche proposte verranno studiate innanzitutto in ambiente controllato attraverso tecniche Monte Carlo che simulino sia le condizioni tipiche in cui gli algoritmi proposti si troveranno ad operare sia le condizioni limiti a cui è possibile spingere le diverse tecniche, mantenendo performance accettabili e risultati affidabili. Successivamente si passerà all'applicazione delle tecniche proposte su insieme di dati reali che includono serie storiche sia di tipo macro-economico (tipicamente a bassa frequenza) sia serie storiche di tipo finanziario (tipicamente ad alta frequenza).Tutte le tecniche e gli algoritmi sviluppati nel corso della ricerca verranno implementati in un package statistico scritto in R, per facilitare l' utilizzo e l'implementazione delle tecniche proposte da parte di altri ricercatori ed utenti finali, con l'intento massimizzare la diffusione e l'impatto dei risultati raggiunti. La scalabilità delle procedure verrà garantita ricorrendo a tecnologie software di calcolo parallelo tipo Map/Reduce e tipo Hadoop.La diffusione dei risultati della ricerca sarà inoltre garantita attraverso pubblicazioni su riviste scientifiche di settore sia nazionali che internazionali, comunicazioni a convegni sia nazionali che internazionali, partecipazioni a seminari e workshops.

DepartmentDipartimento di Scienze Economiche e Statistiche/DISES
FundingUniversity funds
FundersUniversità  degli Studi di SALERNO
Cost2.450,00 euro
Project duration11 December 2013 - 11 December 2015
Proroga11 dicembre 2016
Research TeamLA ROCCA Michele (Project Coordinator)
ALBANO Giuseppina (Researcher)
AMENDOLA Adalgiso (Researcher)
CORETTO Pietro (Researcher)
STORTI Giuseppe (Researcher)