Projects

Cira PERNA Projects

CLUSTERING E PREVISIONE DI SERIE STORICHE AD ELEVATA DIMESIONALITÀ

La costruzione di modelli statistici per database di serie storiche ad alta dimensionalità risulta particolarmente complessa quando le serie osservate presentano composite caratteristiche strutturali quali nonlinearità, nonstazionarietà, alta frequenza e presenza di componenti periodiche. L’idea di ricerca che si vuole sviluppare quindi prevede l’impiego di tecniche di classificazione e di clustering per effettuare una prima fase di preprocessing dei dati al fine di individuare gruppi di serie storiche omogenee rispetto alle loro caratteristiche dinamiche. Sui gruppi così individuati quindi si procede alla specificazione ed alla stima di opportuni modelli di previsione, sia di tipo univariato che multivariato. In una prima fase della ricerca si prenderanno in considerazioni serie storiche che mostrano componenti periodiche a differenti frequenze, memoria lunga e stazionarietà. La motivazione di questo studio nasce da un grande data base di serie storiche sui consumi elettrici di utenti power-users (utenza business e industriale) di una grande compagnia elettrica. Le caratteristiche strutturali dinamiche e la dimensione del database (più di 60000 serie su consumi misurati ogni 10 minuti) impongono lo studio di procedure automatizzate che siano in grado di: (i) individuare in modo efficiente le “features” delle serie (ii) ridurre il carico computazionale e la quantità di informazione registrata. A tal fine verrà studiato un innovativo algoritmo di clustering basato sulla decomposizione di ogni serie in componenti armoniche utilzzando sia la FFT che la DCT. Questi profili strutturali associati ad ogni serie storica verrano dati in imput ad un classificatore di tipo non parametrico, tipo SVM, per la individuazione dei gruppi. Sui gruppi omogeni individuati verrano poi stimati dei modelli statistici per la prevsione del carico rischiesto per ogni gruppo di utenti. Le performance della procedura verranno studiate sia su dati simulati che su insiemi di dati reali. Nello stesso framework teorico, verrà affrontato un altro tipo di problema. La specificazione di modelli per portafogli di asset finanziari di elevata dimensione non è per nulla agevole e non può essere realizzato con strumenti classici. La necessità di specificare modelli per le interdipendenze tra diversi asset comporta la stima di un numero di parametri spesso troppo elevato. Ma anche se la dimensione del problema è ragionevole (diciamo circa 50 assets) l’implementazione di procedure di inferenza classiche non è realizzabile. Il problema spesso viene aggirato stimando modelli eccessivamente semplicistici ottenuti imponendo vincoli (spesso non testabili) di omogeneità sulla struttura dinamica e di dipendenza dei dati. La letteratura recente però ha evidenziato come i rendimenti finanziari siano caratterizzati da una evidente struttura di di gruppo. L’obiettivo della ricerca quindi è duplice. In primo luogo, utilizzando i dati di tutti gli assets dello S&P500, si applicheranno tecniche di clustering model-based per classificare gli attivi finanziari in gruppi omogenei per rischiosità. Le tecniche utilizzato sono di tipo robusto e quindi eventuali valori anomali verranno individuati e classificati in un gruppo a sé stante. In secondo luogo, verranno investigate le conseguenze economiche del clsutering mediante la specificazione e la stima di modelli GARCH multivariati. Ci si aspetta che le proprietà dinamiche della matrice di covarianza condizionata dei rendimenti siano fortemente dipendenti dai livelli di volatilità. Questo risultato fornirebbe un importante argomento a favore di modelli mutivariati condizionalmente eteroschedastici di tipo state-dependent per la previsione della volaitilià di portafoglio. Anche in questo caso la performance della procedura proposta verrà studiata su dati simulati e su dati reali.

DepartmentDipartimento di Scienze Economiche e Statistiche/DISES
FundingUniversity funds
FundersUniversità  degli Studi di SALERNO
Cost2.707,00 euro
Project duration7 November 2014 - 6 November 2016
Proroga6 novembre 2017
Research TeamLA ROCCA Michele (Project Coordinator)
ALBANO Giuseppina (Researcher)
NIGLIO Marcella (Researcher)
PARRELLA Maria Lucia (Researcher)
PERNA Cira (Researcher)