Sådan fjernes Outliers Med en Z-score

Når man analyserer et datasæt , kan du ofte få outliers , de punkter , der ikke synes at matche mønstret af data fra Den øvrige datapunkter. De kan ofte ses ved graftegning dine resultater , da at finde den "best- fit" ligning for et sæt af punkter kan gøre efternølere meget indlysende. De kan være forårsaget af målefejl , ukendte fænomener eller blot unøjagtigheder i den eksperimentelle metode . Brug z- score metode til at fjerne outliers . Instruktioner
1

Beregn både middelværdien og medianen af absolut afvigelse omkring medianen eller MAD , dit datasæt. Sådan beregnes gennemsnittet , tilføje alle de resultater, og dividere dette beløb med antallet af datapunkter. Sådan beregnes medianen af absolut afvigelse omkring medianen , trække middelværdien fra hvert datapunkt , tage den absolutte værdi og finde medianen - midten - værdien af ​​disse resultater
2

Beregn z. - score for hvert datapunkt ved at fratrække befolkningen betyde fra datapunkt , og dividere det svar fra MAD . Dette er, at datapunkt modificerede z- score .
3

beslutte, hvordan du ønsker at bestemme en outlier . Den heuristiske test , at et datapunkt med en modificeret z- score på 3,5 eller derover bør fastlægge en outlier . Afhængig af din forskning , kan du ønsker at fjerne outlier helt, eller indarbejde det i dine resultater og forklare det i din forskning.
Hoteltilbud

https://www.danishgame.com © Hobbyer, spil