Metoder til at underbygge gyldigheden af ​​en test

To vigtige egenskaber af en test er pålidelighed og validitet. I lægmandssprog , pålidelighed er et mål for, hvorvidt scorer på en prøve er gentagelig og internt konsistente . Gyldighed er en målestok for , om testen måler , hvad du tror det måler . Gyldighed er meget sværere at vurdere , og der er flere måder at gøre det . Face Gyldighed

Face gyldighed betyder, at spørgsmål om testen vises gyldig " på deres ansigt ." For eksempel , i en test af aritmetiske for fremmed -gradere , spørgsmål om multiplikation og division ville få store ansigt gyldighed. Formålet med det aritmetiske test vil være klart for de studerende, dog med henblik på spørgsmål om verber og substantiver måske ikke være så indlysende for tredje -gradere , og denne test ville have lav ansigt gyldighed . Normalt er ansigt gyldighed antaget, men nogle gange et spørgsmål kan være gyldig på andre måder , men ikke ansigt - gyldig. .
Kriterium Gyldighed (også kendt som kriteriet gyldighed)

Kriterium gyldighed vurderer resultaterne af en test sammenlignet med nogle kriterium, som allerede er blevet valideret . Ofte den nye test er billigere eller mere praktisk end den tidligere test. For eksempel kan du vurdere gyldigheden af ​​en køresimulator ved at sammenligne det med performance i en faktiske bil. Hvis simulatoren havde god gyldighed , kan det være en billigere (og en mindre farlige) måde at vurdere køreevner .
Construct Gyldighed

Construct gyldighedsperioder foranstaltninger forholdet mellem scorer på en test og foranstaltninger af andre teoretiske konstruktioner. Der er to typer af konstruktion gyldighed : konvergerende og diskriminere . Konvergent validitet betyder, at scorer på en test , bør korrelere stærkt med scorer på test af beslægtede konstruktioner. Diskriminerer gyldighed betyder, at scoringer bør korrelerer dårligt med scorer på test af uafhængige konstruktioner. For eksempel bør scorer på en test af depression korrelerer højere med scorer på angst tests end med scorer på test af aritmetik.
Indholdsvaliditet

Indhold gyldighed betyder, at testen dækker hele spektret af materiale, som det er hensigten at måle. Det vurderes normalt ved at konsultere eksperter på området. For eksempel bør en test af aritmetiske dække alle områder af aritmetiske , der er blevet dækket af børn i en bestemt klasse . Et andet eksempel , bør en test af køreevner dække alle nødvendige færdigheder til at køre en bil.
Hoteltilbud

https://www.danishgame.com © Hobbyer, spil