Oddsförhållande

Ett motiverande exempel, i samband med antagandet om sällsynta sjukdomar Redigera

Tänk dig att det finns en sällsynt sjukdom som, till exempel, bara drabbar en av tusentals vuxna ett land. Tänk dig att vi misstänker att det att bli utsatt för något (säg att ha haft en viss typ av skada i barndomen) gör det mer sannolikt att utveckla den sjukdomen i vuxen ålder. Det mest informativa att beräkna är riskkvoten RR. För att göra detta i idealfallet, för alla vuxna i befolkningen skulle vi behöva veta om de (a) utsattes för skadan som barn och (b) om de utvecklade sjukdomen som vuxna. Från detta skulle vi extrahera följande information: det totala antalet personer som exponerats för barnskadorna, NE, {\ displaystyle N_ {E},} varav DE {\ displaystyle D_ {E}} utvecklade sjukdomen och HE {\ displaystyle H_ {E}} förblev frisk; och det totala antalet personer som inte exponerats, N N, {\ displaystyle N_ {N},} varav D N {\ displaystyle D_ {N}} utvecklade sjukdomen och H N {\ displaystyle H_ {N}} förblev frisk. Eftersom NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} och på samma sätt för NN {\ displaystyle N_ {N}} har vi bara fyra oberoende nummer som vi kan organisera i en tabell:

Diseased Healthy Exposed DEHE Inte exponerad DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {Diseased }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {Ej exponerad}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

För att undvika eventuell förvirring betonar vi att alla dessa siffror hänför sig till hela befolkningen, och inte till något urval av det.

RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

som kan skrivas om som RR = DENNDNNE = DE / DNNE / NN. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}

ELLER = DE / HEDN / HN, {\ displaystyle ELLER = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} som kan skrivas om som ELLER = DEHNDNHE = DE / DNHE / HN. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}

Ofta kan vi övervinna detta problem genom att använda slumpmässiga urval av befolkningen: nämligen om varken sjukdomen eller exponeringen för skadan är för sällsynta i vår befolkning kan vi välja (säg ) hundra människor slumpmässigt och ta reda på dessa fyra siffror i det urvalet; förutsatt att urvalet är tillräckligt representativt för befolkningen, så kommer den beräknade RR för detta urval att vara en bra uppskattning för RR för hela befolkningen.

Vissa sjukdomar kan dock vara så sällsynta att med all sannolikhet , till och med ett stort slumpmässigt urval kanske inte ens innehåller en enda sjuk individ (eller det kan innehålla några, men för få för att vara statistiskt signifikanta). Detta skulle göra det omöjligt att beräkna RR. Men vi kan ändå kunna uppskatta OR, förutsatt att exponeringen för barndomsskada, till skillnad från sjukdomen, inte är för sällsynt. Naturligtvis, eftersom sjukdomen är sällsynt, är detta då också vår uppskattning för RR.

Tittar på det slutliga uttrycket för OR: bråk i täljaren, DE / DN, {\ displaystyle D_ { E} / D_ {N},} kan vi uppskatta genom att samla alla kända fall av sjukdomen (förmodligen måste det finnas några, annars skulle vi sannolikt inte göra undersökningen i första hand) och se hur många av de sjuka människorna hade exponeringen och hur många som inte hade det. Och fraktionen i nämnaren, HE / HN, {\ displaystyle H_ {E} / H_ {N},} är oddsen att en frisk individ i befolkningen exponerades Observera att dessa senare odds verkligen kan uppskattas genom slumpmässigt urval av befolkningen – förutsatt, som vi sa, att förekomsten av exponeringen för barnskador inte är för liten, så att ett slumpmässigt urval av en hanterbar storlek skulle sannolikt innehålla ett ganska stort antal individer som har utsatts för. Så här är sjukdomen mycket sällsynt, men faktorn trodde att bidra till det är inte riktigt så sällsynt; sådana situationer är ganska vanliga i praktiken.

Således kan vi uppskatta ELLER, och sedan, med åberopande av det sällsynta sjukdomsantagandet, säger vi att detta också är en bra approximation av RR. För övrigt är scenariot som beskrivs ovan ett paradigmatiskt exempel på en fallkontrollstudie.

Definition i termer av gruppvisa oddsRedigera

Oddskvoten är förhållandet mellan oddsen för en händelse som inträffar i en grupp till oddsen att den inträffar i en annan grupp. Termen används också för att referera till provbaserade uppskattningar av detta förhållande. Dessa grupper kan vara män och kvinnor, en experimentell grupp och en kontrollgrupp eller någon annan dikotom klassificering.Om sannolikheten för händelsen i var och en av grupperna är p1 (första grupp) och p2 (andra grupp), är oddskvoten:

p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {p_ {1} / (1-p_ {1}) \ över p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ över p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}

där qx = 1 – px. Ett oddsförhållande på 1 indikerar att tillståndet eller händelsen som studeras är lika sannolikt att inträffa i båda grupperna. Ett oddsförhållande större än 1 indikerar att det är mer sannolikt att tillståndet eller händelsen inträffar i den första gruppen. Och ett oddsförhållande mindre än 1 indikerar att tillståndet eller händelsen är mindre benägna att inträffa i den första gruppen. Oddskvoten måste vara icke-negativ om den definieras. Det är odefinierat om p2q1 är lika med noll, dvs om p2 är lika med noll eller q1 är lika med noll.

Definition i termer av gemensamma och villkorliga sannolikheter Redigera

Oddsförhållandet kan också definieras i termer av den gemensamma sannolikhetsfördelningen av två binära slumpmässiga variabler. Den gemensamma fördelningen av binära slumpmässiga variabler X och Y kan skrivas

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

där p11, p10, p01 och p00 är icke-negativa ”cellsannolikheter” som summerar till en. Oddsen för Y inom de två delpopulationerna definierade av X = 1 och X = 0 definieras i termer av de villkorliga sannolikheterna som ges X, dvs P (Y | X):

Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}

Således är oddskvoten

p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

Det enkla uttrycket till höger ovan är lätt att komma ihåg som th produkten av sannolikheterna för de ”konkordanta cellerna” (X = Y) dividerat med produkten av sannolikheterna för de ”överensstämmande cellerna” (X-Y). Observera dock att i vissa applikationer är märkningen av kategorier som noll och en godtycklig, så det finns inget speciellt med överensstämmande kontra överensstämmande värden i dessa applikationer.

SymmetryEdit

Om vi hade beräknat oddskvoten baserat på de villkorliga sannolikheterna som ges Y,

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

vi skulle ha fått samma resultat

p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}

Andra mått på effektstorlek för binära data såsom den relativa risken har inte denna symmetriegenskap.

Förhållande till statistik oberoende Redigera

Om X och Y är oberoende kan deras gemensamma sannolikheter uttryckas i termer av deras marginella sannolikheter px = P (X = 1) och py = P (Y = 1) enligt följande

Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}

I detta fall , är oddskvoten lika med en, och omvänt kan oddskvoten bara vara lika med en om den gemensamma proban biliteter kan tas med på detta sätt. Således är oddskvoten lika med en om och endast om X och Y är oberoende.

Återställa cellsannolikheterna från oddskvoten och marginalsannolikheter Redigera

Oddskvoten är en funktion av cellen sannolikheter, och omvänt, cellsannolikheterna kan återvinnas med tanke på kunskap om oddskvoten och marginalsannolikheterna P (X = 1) = p11 + p10 och P (Y = 1) = p11 + p01.Om oddskvoten R skiljer sig från 1 är

p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}

där p1 • = p11 + p10, p • 1 = p11 + p01, och

S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}

Om R = 1 har vi oberoende, så p11 = p1 • p • 1.

När vi har p11, kommer de andra tre cellerna sannolikheter kan enkelt återställas från marginalsannolikheterna.

Write a Comment

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *