Hvordan finder man et problem med en residualplot

I statistik residualerne er forskellene mellem værdierne for den afhængige variabel forudsagt af modellen og de værdier den faktiske afhængige variabel. Almindelig regression antager, at residualerne normalt fordelt. Det forudsætter endvidere, at variansen af ​​residualerne er konstant på tværs af niveauer af de uafhængige variable, og at residualerne ikke er relateret til den uafhængige. En måde at kontrollere de sidste to antagelser er at se på et residualplot , som afbilder en uafhængig variabel på x-aksen og residualerne på y-aksen. Instruktioner
1

Kontroller for ændringer i udbredelsen af ​​varians som de uafhængige variable stigninger . Kig på residualerne nær den nedre ende af x-aksen , nær midten af ​​x-aksen og nær den øvre ende . Afstanden mellem de højeste og laveste rester bør være omtrent lige på tværs af niveauer af den uafhængige variabel. Hvis de ikke er , har du et problem, kendt som heteroskedasticitet .
2

Kig efter en stigning eller et fald i residualerne som den uafhængige variabel stiger. På alle niveauer af den uafhængige variabel , residualerne burde være centreret omkring 0. Der bør være hverken en forøgelse eller reduktion , der bør heller ikke være en U-formet mønster (lav i midten, høj i begge ender ) eller en omvendt U formet mønster. Handlingen skal ligne en klat . Hvis det ikke gør, så har du et problem med de variabler , der er i modellen.
3

Kig efter outliers . Ingen resterende burde være langt højere end de andre . Hvis ét punkt springer ud , eller et par gøre enten meget lavere eller meget højere end de andre, så de kan være forbundet med vildskud . Dette kunne være en indtastning af data fejl , eller det kan være en yderst usædvanlig sag .
Hoteltilbud

https://www.danishgame.com © Hobbyer, spil