Valori anomali servono una funzione importante per gli statistici e matematici analizzare i dati . Anche se non necessariamente difficile da individuare una volta che sai cosa cercare , capire il loro significato spesso richiede un’analisi più approfondita dei dati e dei processi in atto per raccogliere tali dati . Riconoscendo l’anomalia di valori anomali è spesso un primo passo per determinare la validità dei risultati statistici . Definizione

Un valore anomalo è, essenzialmente , una anomalia statistica che di solito è abbastanza facile da riconoscere . Si tratta di un numero , o una serie di numeri , che cade ben al di fuori della gamma di ciò che uno statistico o matematico trova accettabile , sulla base delle altre figure in un insieme di dati . Poiché un outlier è lontano da altre figure , ha il potenziale per inclinare medie .

Esempio

Definizione di un outlier può essere meglio spiegato con l’esempio . Se uno statistico o matematico svolge attività di ricerca o un sondaggio di qualche tipo , ed i risultati sono i seguenti : 3 , 15 , 18 , 21 , 26 , 31 e 58 , ci sono due valori anomali. In questo caso , sia il 3 e il 58 sarebbero considerati valori anomali come sono significativamente diversi da , o al di fuori del campo di applicazione , gli altri punti dati .

Possibili motivi

Valori anomali accadere per molte ragioni , di solito relativamente semplici errori o omissioni . Ad esempio , forse c’era un errore umano nella trascrizione delle informazioni . Se , nell’esempio di cui sopra , il 3 è stato semplicemente frainteso avrebbe dovuto essere 13 , non sarebbe un outlier . Può anche essere che un passo nel processo è stata trascurata durante una fase di studio , ma non gli altri . Questi servono come buoni indicatori di potenziali problemi nei dati e forniscono ai ricercatori l’opportunità di esaminare da vicino i processi utilizzati per individuare eventuali carenze .

Riguarda

determinare quali valori sono valori anomali è, in larga misura , a discrezione dello statistico . Questo può portare a possibili distorsioni che i dati , scartando quelli che vengono percepiti come valori anomali , possono essere manipolati dallo statistico per assomigliare più da vicino i risultati desiderati . Decidendo che un numero o più numeri , sono semplicemente valori anomali possono cambiare in modo significativo che i dati , forse corrompendo esso .