matematisk & Statistiske metoder til genetisk analyse

Genetik er en gren af ​​beskæftiger sig med studiet af gener , variation og arvelige i dyr og planter biologi . Matematik og statistik spiller en stor rolle i den disciplin af genetik , især underdisciplin af populationsgenetik . Populationsgenetik studerer frekvens og distribution af forskellige alleler i en bestemt population af organismer , og hvordan de relaterer til andre populationer af organismer. Alleler er dele af den genetiske kode, der er forbundet med bestemte egenskaber. Gennemsnit

mest basale form for statistisk analyse er gennemsnittet . Der findes tre former for gennemsnit : middelværdi, median og modus . Den gennemsnitlige findes ved at finde summen af ​​et sæt data og dividere denne sum med antallet af datapunkter. Medianen findes ved alle datapunkter i størrelsesorden og vælge den midterste datapunkt. Tilstanden er simpelthen den dataværdi , der vises oftest . Alle tre typer af gennemsnit anvendes i populationsgenetik , men det mest almindelige er middelværdien.
Varians

Variansen er et mål for, hvor meget værdierne i en datasæt varierer. Variansen er symboliseret ved s ^ 2 eller en sigma kvadreret symbol. Variansen beregnes ved at finde summen af ​​kvadratet af forskellen mellem hver værdi og middelværdien og derefter dividere med en mindre end antallet af datapunkter . Et eksempel på varians kan indebære antallet af pletter på en bestemt art af bille. Antage, at der er fem biller i sættet , og antallet af pletter på hver bille er 5 , 5, 6 , 6 og 8 Gennemsnittet er : .

( 5 + 5 + 6 + 6 + 8) /5 = 6

varians beregnes som følger : Hej

[(5 - 6) ^ 2 + (5 - 6) ^ 2 + (6 - 6) ^ 2 + ( 6 - 6) ^ 2 + (8 - 6) ^ 2 ] /(5 - 1) = 1,5

det giver os en indikation af spredningen af ​​de værdier

standardafvigelse

standardafvigelsen er et andet mål for spredning. Det er kvadratroden af variansen . Det har den fordel , at det har de samme enheder som de datasæt det stammer fra . I eksemplet ovenfor standardafvigelsen er : Hej

(1,5) ^ (0,5) = 1,22474

Dette indikerer, at standardafvigelsen i antallet af pletter på populationen af ​​biller er ca 1.22 pletter.
Korrelation

Korrelation er et mål for mængden af ​​sammenhængen mellem to datasæt . I populationsgenetik kan korrelationer blive brugt til at undersøge forholdet mellem besiddelse af bestemte gener og tilfælde af særlige egenskaber . Korrelation er symboliseret ved en r med sænket xy , hvor x og y er variable i de to datasæt. Korrelationer er altid mellem -1 og 1 . Betyder -1 der er en negativ korrelation, 0 betyder, at der ikke er nogen sammenhæng , og 1 betyder, at der er en positiv sammenhæng .
Regression

Regression er en statistisk værktøj, der anvendes til at finde forholdet mellem to variabler. Regressionskoefficienten får symbolet b med sænket YX , hvor y og x er variable i de to datasæt. Regressionskoefficienten måler forudsagte ændring i ay variabel pr en enhed ændring i variablen x .
Genetiske sygdomme nomenklatur

Når diskuterer genetisk sygdom , er der flere tekniske termer , der beskrive mønsteret af lidelsen i den almindelige befolkning . Disse udtryk omfatter incidens, prævalens, dødelighed og levetid risiko. Forekomsten af ​​en genetisk lidelse, er andelen af ​​mennesker i befolkningen med en bestemt genetisk sygdom. Forekomsten af ​​en genetisk lidelse, er antallet af personer inden for en specifik undergruppe , såsom en bestemt aldersgruppe , der har en bestemt genetisk lidelse. Dødelighed refererer til antallet af personer i en bestemt gruppe, der dør af en given sygdom årligt. Et eksempel på en dødelighed statistik kunne være " 10 000 mennesker i USA døde af syndrom X i 2010. " Lifetime risiko er den gennemsnitlige risiko for at udvikle en bestemt genetisk sygdom på et tidspunkt i en persons liv .
Hoteltilbud

https://www.danishgame.com © Hobbyer, spil