analisi discriminante è un metodo di classificazione che utilizza misure statistiche come covarianza e misure geometriche come distanza euclidea per determinare quale gruppo un punto di dati sconosciuti appartiene . Usando l’analisi discriminante prevede due fasi principali : trovare i coefficienti discriminanti da un insieme ben compreso dei dati e applicando i coefficienti di dati sconosciuti per produrre classifications.Things gruppo che ti serviranno

Software di statistica ( R , SPSS , SAS o S + )

Mostra Altre istruzioni

1

decidere sulle variabili che si desidera includere nello studio. Queste variabili dovrebbero essere le caratteristiche che si ritiene aiuterà classificare punti dati in specifici gruppi mutuamente esclusivi . Ad esempio, se i gruppi sono ad essere “uomini e donne”, le possibili variabili includono il numero di figli , anni di scolarizzazione e di reddito annuo .

2

raccogliere una serie di dati che possono essere classificati in mutuamente gruppi esclusivi (ad esempio , uomini e donne , compratori e venditori , o cinesi e taiwanesi ). Raccogliere i dati sulle variabili che avete precedentemente decise per ogni punto dati .

3

Calcolare i centroidi per ogni gruppo . Il calcolo dei centroidi dipende dal numero di variabili che si è scelto di includere nell’analisi . Ad esempio , se avete deciso di indagare solo due variabili , allora esisteranno le vostre centroidi in euclideo 2 -spazio.

4

Calcolare la distanza tra i due baricentri , e denotano questa distanza come un vettore , “D “. Il vettore sarà come molte dimensioni del numero di variabili di interesse . Nel caso in cui si sta indagando due variabili , i vettori , “d “, sarà bidimensionale .

5

Calcolare la somma all’interno del gruppo delle piazze matrici per ciascun gruppo . Chiamare queste matrici ” W1 ” e ” W2 “.

6

Pool la somma all’interno del gruppo di matrici quadrate di produrre una matrice all’interno del gruppo covarianza . Chiamare questa matrice ” Cw “.

7

calcolare l’inverso di ” Cw “. Chiamare questa matrice inversa ” Cw – 1 “.

8

Multiply ” Cw – 1″ e ” d “. Chiama questo vettore ” Cw – 1d . ” La sua dimensione deve essere uguale al numero di variabili è stato incluso nell’analisi .

9

Calcolare i coefficienti della funzione discriminante . Questi coefficienti sono proporzionali a ” Cw – 1d “.

10

Raccogliere dati di interesse ( dati che si desidera classificare in gruppi ) . Per applicare correttamente l’analisi discriminante , solo raccogliere dati sulle variabili di interesse; conoscendo le classifiche sconfigge in anticipo allo scopo di effettuare analisi discriminante .

11

Scrivi ogni punto di dati come un vettore . Le dimensioni dei vettori sono uguali alle dimensioni del set di dati originale .

12

classificare ciascun punto di dati . Moltiplicare ogni punto dati per i coefficienti della funzione discriminante . L’output vi darà la classificazione del punto dati . Ad esempio , se si utilizza anni di scolarizzazione e reddito annuale come variabili per predire il genere dei punti di dati , il numero risultante sarà o essere più vicino al “maschio ” o ” femmina”. Il gruppo il punto è più vicino è il gruppo è classificato come .