Progetti

Ricerca Progetti

STIMA DI MATRICI DI VARIANZA-COVARIANZA: ROBUSTEZZA E DIMENSIONALITA'

Tutti i contributi sopra elencati dipendono da costanti di tunings che ne determinano sia i livelli di robustezza che di bias-efficienza. In secondo luogo per alcuni di essi le proprietà distributive, e quindi l'inferenza, sono difficili da derivare. In ultimo, per molti di essi esistono limiti computazioni notevoli già per piccole dimensioni (secondo i canoni moderni). Va ribadito che nessuna delle proposte esistenti è in grado di fornire risposte adeguate nel caso in cui n/p è prossimo all'unità, e/o il tipo di contaminazione è in un intorno della point mass. In questo progetto di ricerca vogliamo raggiungere alcuni obiettivi innovativi:1. dare una definizione di outliers che dipenda dal modello di riferiemento e dalla dimensione campionaria;2. arrivare alla definizione di stimatori robusti di locazione e scala che siano consistenti rispetto alla definizione di outliers;3. i parametri di tunings/regolarizzazione devono avere una chiara interpretazione in termini di analisi dei dati;4. vogliamo fornire risposte accettabili, se non ottimali, nel contesto n/p circa uguale 1 almeno in condizioni di sparsità rispetto al modello ellissoidale;5. le stime devono essere facilmente calcolabili. Il progetto è di costruire una classe di stimatori location-scale partendo dal RIMLE di Coretto Hennig (2013). Nel contesto di questo lavoro questo significa che ci proponiamo di modellare le regioni di densità dei punti osservati attraverso una funzione di pseudo-verosimiglianza ottenuta da una mistura di una densità Gaussiana ed una densità impropria positiva su ogni punto dello spazio dei dati ove la massa "principale dei dati" è trascurabile. L'idea è che la densità rappresentante gli outliers deve assomigliare ad un buco-nero che non ha massa laddove ci si aspetta che vi sia la massa Gaussiana. Siccome tale componente è positiva nella regione di coda della normale di riferimento, essa consentirà di accomodare qualsiasi tipo di outlier anche nelle forme più estreme. Le stime di interesse saranno ottenute come massimi della funzione di pseudo-verosimiglianza associata al pseudo-modello suddetto. Inoltre la funzione obiettivo deve tener conto di vincoli sulle componenti spettrali della matrice di varianza-covarianza che siano in grado di garantire l'esistenza della sua inversa anche quando n < = p+1. Una possibile soluzione è quella di imporre vincoli in termini di condition-number. Quest'ultimo ha una interessante conessione con le proprietà geometriche dei dati. Ci saranno diversi aspetti da analizzare:1. sviluppare una procedura automatica adattiva per la scelta della densità impropria;2. sviluppare, ove possibile, soluzioni di ottimizzazione numerica veloci per il calcolo delle stime;3. quantificare il livello di robustezza attraverso misure bene note quali: breakdown-point, funzione di influenza, etc;4. derivare risualtati asintotici quali la consistenza rispetto alla definizione di cui al punto 1 nel caso di classi ristrette di processi generatori dei dati;5. produrre esperimenti simulati ad ampio spettro per verificarne le proprietà su dati artificiali.

StrutturaDipartimento di Scienze Economiche e Statistiche/DISES
Tipo di finanziamentoFondi dell'ateneo
FinanziatoriUniversità  degli Studi di SALERNO
Importo2.450,00 euro
Periodo11 Dicembre 2013 - 11 Dicembre 2015
Proroga11 dicembre 2016
Gruppo di RicercaCORETTO Pietro (Coordinatore Progetto)
LA ROCCA Michele (Ricercatore)
PARRELLA Maria Lucia (Ricercatore)
STORTI Giuseppe (Ricercatore)