Research | Projects
Research Projects
METODI NONPARAMETRICI PER LA SELEZIONE DEL MODELLO
I metodi nonparametrici sono particolarmente utili nello stadio preliminare dell'analisi dei dati, per esempio per fare selezione di variabili, model structure discovering e test sulla bontà di adattamento. Infatti, mentre un modello ben specificato è caratterizzato da un'inferenza precisa, un modello erratamente specificato conduce a risultati inconsistenti. In altre parole, i modelli nonparametrici sono associati ad una maggiore robustezza ma a una minore precisione.Tuttavia, una critica spesso fatta alle procedure nonparametriche è che esse sono time consuming e non ``user-friendly'', poichè la loro performance dipende crucialmente da alcuni parametri di regolarizzazione che sono difficili da impostare. Questo influenza marcatamente le potenzialità di tali procedure. Per promuovere l'utilizzo delle procedure nonparametriche, quindi, bisognerebbe renderle il più possibile automatiche e facili da implementare. Nello stesso tempo, esse devono garantire la proprietà oracolo sotto assunzioni generali. Pertanto, questi obiettivi assumeranno alta priorità nel presente progetto di ricerca.Il framework considerato nel presente progetto prevede che il numero di covariate del modello di regressione può divergere, ma soltanto alcune di queste covariate vengono assunte rilevanti per il modello (assunzione di sparsity). Dato che la forma del modello non viene specificata, l'obiettivo diventa identificare le covariate rilevanti e ottenere alcune informazioni circa la struttura del modello. Si punta ad una procedura nonparametrica avente le seguenti caratteristiche:(a) le covariate rilevanti del modello vengono automaticamente identificate, e vengono distinte tra covariate lineari e nonlineari. Una covariata viene definita lineare/nonlineare a seconda della relazione marginale tra la variabile risposta e tale covariata, che corrisponde a un gradiente constante/noncostante);(b) vengono identificate le interazioni tra le covariate, senza necessità di considerare le classiche procedure di tipo stepwise. In particolare, la complessità computazionale dell'algoritmo non deve essere incrementata all'aumentare dell'ordine dell'interazione (a due componenti, a tre, ecc...);(c) la procedura deve essere completamente data-driven, in modo da renderla facile all'utilizzo su dati reali. In particolare, essa non deve dipendere dalla selezione di parametri di tuning, nè deve richiedere la stima di parametri di disturbo quale la varianza degli errori (self scaling). A tal fine, si farà uso di procedure inferenziali nonparametriche basate sulla verosimiglianza empirica.Il presente progetto di ricerca si pone nello stesso framework considerato nel lavoro di Lafferty e Wasserman, pubblicato nel 2008. L'obiettivo che ci si pone è quello di estendere e, laddove possibile, generalizzare alcuni risultati ivi prodotti. Inoltre, si introduce come obiettivo quello della selezione del modello oltre che la scelta delle variabili rilevanti. La procedura di stima e selezione si baserà sull'utilizzo congiunto di due strumenti nonparametrici: gli stimatori dei polinomi locali e la tecnica inferenziale della verosimiglianza empirica. Il punto di forza che si intravede nella proposta è quello di sfruttare tutte le caratteristiche di tali metodi ma anche di trarre vantaggio dalla complementarietà dei due strumenti, per cui i punti di debolezza dell'uno possono essere compensati dai punti di forza dell'altro, in modo da perseguire nel miglior modo possibile l'obiettivo finale: la selezione e la classificazione delle variabili rilevanti e la stima della struttura additiva del modello di regressione, possibilmente in alta dimensionalità.
Department | Dipartimento di Scienze Economiche e Statistiche/DISES | |
Principal Investigator | PARRELLA Maria Lucia | |
Funding | University funds | |
Funders | Università degli Studi di SALERNO | |
Cost | 2.300,00 euro | |
Project duration | 28 July 2015 - 28 July 2017 | |
Research Team | PARRELLA Maria Lucia (Project Coordinator) AMENDOLA Alessandra (Researcher) CANDILA VINCENZO (Researcher) CESALE GIANCARLO (Researcher) GIORDANO Francesco (Researcher) NAIMOLI ANTONIO (Researcher) PACELLA MASSIMO (Researcher) RESTAINO Marialuisa (Researcher) |