Hvad er R2 Lineær regression

? Statistikere og forskere har ofte et krav om at undersøge sammenhængen mellem to variable , almindeligvis kaldet x og y . Formålet med at teste to sådanne variabler er normalt at se, om der er en vis sammenhæng mellem dem , der er kendt som en sammenhæng i videnskab. For eksempel kan en videnskabsmand ønsker at vide, hvis timers udsættelse for sol kan knyttes til satser for hudkræft. Til matematisk beskrive styrken af ​​en sammenhæng mellem to variable , sådanne efterforskere bruger ofte R2. Lineær regression

statistikere bruge teknikken med lineær regression for at finde den rette linje , der bedst passer til en række af X og Y datapar . De gør dette gennem en serie af beregninger, som stammer ligning bedste linje . Denne matematiske beskrivelse af linjen vil være en lineær ligning og har den generelle form af y = mx + b , hvor x og y er de to variabler i dataparrene m er hældningen af ​​linien og b er dens y-aksen .
Korrelationskoefficient

de beregninger, som finde den bedste rette linje vil producere en lineær ligning til at passe enhver datasæt , også selv om , at data ikke er faktisk meget lineær . For at få en indikation af , hvor godt de data, der faktisk passer til en lige linje , statistikere også beregne et tal kaldes korrelationskoefficienten. Dette er givet symbolet R eller R og er et mål for, hvor nøje afstemt dataparrene er den bedste rette linje gennem dem.
Betydningen af ​​R

R kan have en værdi mellem -1 og 1. En negativ værdi af R betyder blot, at den bedst passende rette linje nedad Skråningerne bevæger sig mod venstre til højre , snarere end opad. Jo tættere R er til enten af de to ekstremer , jo bedre pasningen af ​​datapunkter til den linje , med enten -1 eller 1 er en perfekt pasform og en R-værdi på nul betyder, at der ikke er nogen egnet og de ​​punkter er helt tilfældigt . Hvis datapunkterne er godt afstemt med den rette linje , er der siges at være en vis sammenhæng mellem dem , deraf navnet korrelationskoefficient for R.
R2

Nogle statistikere foretrækker at arbejde med værdien R2 , som simpelthen er korrelationskoefficienten kvadreret, eller ganget med sig selv , og er kendt som determinationskoefficienten . R2 er meget lig R og også beskriver sammenhængen mellem de to variabler , men det er også lidt anderledes. Den måler procent af variationen i y variabel, der kan tilskrives variation i x variabel. En R2 værdi på 0,9 , for eksempel betyder, at 90 procent af variationen i y -data skyldes variation i x data. Dette betyder ikke nødvendigvis , at x er virkelig påvirker y, men at det synes at være at gøre det.
Clipart

https://www.danishgame.com © Hobbyer, spil