analisi statistica spesso sperano di generalizzare piccoli , singoli dataset di grandi dimensioni, popolazione generale . Quando si eseguono le analisi , i ricercatori hanno spesso a che fare con rigidi , piccoli insiemi di dati . Tuttavia, è spesso desiderabile ” liscio ” questi dati , cambiando un istogramma rigido in una curva . Non parametrico , kernel stima della densità fa esattamente questo . Questa funzione è non parametrico in quanto non assume c’è una struttura fissa associata ai dati . In questo processo , si applicherà un kernel ( una funzione che ti cambia la dataset originale in un nuovo set di dati ) per il set di dati per stimare un dataset.Things liscia che ti serviranno

software statistici

Mostra Altre istruzioni

1

Inserire i dati nel software statistico . Non parametrico , stima della densità kernel può essere applicata solo ai dati monodimensionali, quindi se i dati è multidimensionale , si dovrà eseguire la stima della densità di una variabile alla volta .

2

Scegliere il kernel essere utilizzato . La maggior parte dei programmi statistici offrono una vasta scelta di kernel . Ad esempio , il programma statistico , R , offre gaussiana , triangolari , rettangolari , Epanechnikov , doppio peso , coseno e optcosine kernel . In generale , kernel rettangolari e triangolari tendono ad essere meno liscia , mentre i kernel gaussiano e Epanechnikov tendono a portare a distribuzioni uniformi. La scelta più comune kernel è il kernel gaussiano , ma si può sperimentare con più kernel .

3

Scegli la larghezza di banda per la stima . La larghezza di banda agisce come la deviazione standard del kernel smoothing e influisce sulla forma della distribuzione finale stimato . Scelta della larghezza di banda è un complesso , argomento fortemente dibattuto nelle statistiche e non c’è un unico modo per scegliere una larghezza di banda adeguata . E ‘ meglio fare esperimenti con molte larghezze di banda , osservando la distribuzione risultante . In generale , vi è un compromesso tra varianza e polarizzazione per larghezze di banda di diverse dimensioni . La scelta di una larghezza di banda maggiore diminuisce la varianza aumentando la polarizzazione; scegliendo la larghezza di banda più piccola aumenta la varianza riducendo la polarizzazione .

4

Eseguire la funzione stima della densità kernel non parametrico . Software statistico vi chiederà di inserire i dati , kernel e la larghezza di banda su chiamare questa funzione . Ad esempio in R , il comando è ” densità ( dati , larghezza di banda , kernel) . ”

5

tracciare i risultati . Tracciare l’uscita della funzione di densità vi permetterà di vedere come la stima della densità cambiato la forma dei dati . Se eseguita correttamente , dovrebbe apparire come una versione più agevole dei dati originali .