? Regressione lineare è conosciuta come una linea di best fit . Cercando di trovare una linea retta che meglio rappresenta i punti tracciati di dati osservabili su un grafico aiuta a comprendere la correlazione tra i dati , se c’è . Una volta un’equazione per una linea di regressione è derivato , può essere utilizzato per prevedere possibili valori futuri che devono ancora essere osservati . Regressione lineare
Ci sono diversi aspetti di un modello di regressione lineare , o la ricerca di una migliore linea di adattamento . Il primo passo è quello di raccogliere i dati relativi a due tratti presumibilmente correlati, come l’altezza e il peso di diverse persone a caso . Nei problemi più avanzati di regressione , una correlazione tra due variabili non è così ovvio , ma per il bene di comprensione ci terremo questa semplice . Altezza e peso sono raccolti e messi in una tabella – questi numeri sono i vostri dati , e sono le variabili nella equazione di regressione , che rappresenteranno la linea di best fit . Si tracciano i dati su un grafico , con una variabile per ogni asse . Si noti che i punti sul grafico sembrano essere correlate , in quanto si stanno muovendo nella stessa direzione . Il più alto di una persona è , più pesa . Potete vedere la correlazione .
Minimi quadrati Regressione
Mentre un semplice esempio può essere lavorato manualmente , e dovrebbe essere per i principianti , il processo di regressione lineare è fatto automaticamente da calcolatrici grafiche . Minimi quadrati regressione è il processo mediante il quale una linea di best fit deriva e sua equazione , in forma di y = mx + b , viene scoperto . Si utilizza un processo di calcoli dai dati; questi calcoli sono una combinazione di sommare osservabili valori di xey , li squadratura, sottraendo loro e li divide . Una volta che sapete che cosa ogni valore nella formula rappresenta , è una semplice questione di collegare i numeri su una calcolatrice e registrare il valore delle operazioni . Il risultato è un’equazione per la retta di regressione o di regressione; è una linea retta che può essere disegnata attraverso i punti di dati che meglio rappresenta la loro correlazione matematicamente .
Residui
I residui sono la distanza tra i punti di dati e la linea di regressione . Tenuto conto residui permette all’osservatore di conoscere la validità del suo presupposto che vi sia una correlazione tra tali dati . Nella maggior parte dei problemi di regressione , parte della soluzione è scoprire se esiste una correlazione affatto , a differenza di altezza e peso . Su una calcolatrice grafica , un nuovo grafico può essere fatta esclusivamente dei residui , e la variabile indipendente , che può dare via la presenza di variabili in agguato .
Variabili agguato
una variabile in agguato può esistere quando i punti dati producono una scarsa linea di regressione , o valori anomali. Una variabile agguato è semplicemente un fattore di problema che colpisce i dati, ma non può essere stato preso in considerazione inizialmente. Altezza e peso sono correlati , ma per spiegare un grafico in cui non vi è alcuna correlazione tra di loro , potremmo immaginare che l’assunzione di cibo e /o l’esercizio fisico è una variabile in agguato che rende una persona breve pesante , o una persona alta sottile . Un punto che rappresenta uno di questi scenari si troverebbe lontano dalla linea di regressione e hanno un elevato residuo .
Outliers
Il punto dato che è la più lontana dalla linea di regressione sul grafico ha il più grande valore residuo . Un termine per i punti che sono lontani dalla linea di regressione è outlier . Valori anomali sono importanti perché possono rappresentare dati errati o una linea di scarsa forma, e possono cambiare la pendenza della linea in modo significativo .