In situazioni di vita reale che trattano i dati , il set di dati comprende molte variabili indipendenti e una sola variabile dipendente . Gli statistici ed altri ricercatori spesso desiderano utilizzare le variabili indipendenti per prevedere la variabile dipendente . Un metodo comune per farlo è quello di utilizzare la regressione , che estrae dai dati una funzione predittiva che può essere poi utilizzato per prevedere la variabile dipendente di dati che include solo le variabili indipendenti . Una delle più recenti forme di regressione è quella di regressione polinomiale locale , che è stato creato alla fine del 1970 . Questo metodo di regressione può assumere diverse forme . Nonparametric
Nonparametric regressione polinomiale locale stima una funzione che è continua ( senza spazi ) . Il fatto che la funzione è continua permette di avere diversi derivati , se il numero di derivati non sarà nota solo la funzione di stima , in quanto si basa sulla misura della funzione polinomiale . Il vantaggio del metodo non parametrico è che non richiede al ricercatore di conoscere la forma della funzione prima di eseguire la regressione .
Bandwidth Matrix
Il metodo della matrice di banda consente al ricercatore di selezionare una matrice prima di eseguire la regressione . Questa matrice deve essere quadrata ( cioè con il numero di righe uguale al numero di colonne ) e hanno una larghezza di riga /colonna pari al numero di variabili indipendenti . Il punto della matrice larghezza di banda è di dare la flessibilità ricercatore nel determinare la quantità di smoothing locale che la funzione impiegherà . Smoothing locale è molto più quello che sembra : . Che determina il grado di ” morbidezza ” della funzione a scala locale , rendendolo sia più semplice o complessa
minimi quadrati ponderati
comune in altre forme di regressione , ponderate metodi minimi quadrati può essere applicato a regressione polinomiale locale. Il metodo di minimi quadrati ponderati regressione polinomiale locale pone ulteriori vincoli sulla funzione di regressione . Questo metodo offre due vantaggi . In primo luogo , esso riduce la distorsione della funzione di regressione , dando più applicabilità . In secondo luogo, si abbassa la varianza , aumentando la precisione della funzione .
Automatic Bandwidth Selezione
Come alternativa al metodo a matrice di banda standard, il metodo di selezione di banda automatica sceglie la matrice di banda per il ricercatore . Questo metodo utilizza un algoritmo che tenta di ridurre la varianza dei dati applicando assunzioni di struttura alla funzione di regressione . Tuttavia , per questo metodo , ci sono gli inconvenienti di sopravvalutare la struttura dei dati e la produzione di una funzione di regressione unsmooth .