Odds ratio

Een motiverend voorbeeld, in de context van de aanname van zeldzame ziekten. Edit

Stel je voor dat er een zeldzame ziekte is die bijvoorbeeld slechts één op de vele duizenden volwassenen treft in een land. Stel je voor dat we vermoeden dat blootstelling aan iets (bijvoorbeeld een bepaald soort letsel in de kindertijd hebben gehad) de kans op het ontwikkelen van die ziekte op volwassen leeftijd vergroot. Het meest informatieve om te berekenen is de risicoverhouding, RR. Om dit in het ideale geval te doen, zouden we voor alle volwassenen in de populatie moeten weten of zij (a) als kind aan de verwonding waren blootgesteld en (b) of zij de ziekte als volwassenen ontwikkelden. Hieruit zouden we de volgende informatie halen: het totale aantal mensen dat is blootgesteld aan de verwonding bij kinderen, NE, {\ displaystyle N_ {E},} waaruit DE {\ displaystyle D_ {E}} de ziekte heeft ontwikkeld en HIJ {\ displaystyle H_ {E}} bleef gezond; en het totale aantal niet-blootgestelde mensen, N N, {\ displaystyle N_ {N},} waarvan D N {\ displaystyle D_ {N}} de ziekte ontwikkelde en H N {\ displaystyle H_ {N}} gezond bleef. Omdat NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} en op dezelfde manier voor de NN {\ displaystyle N_ {N}} getallen, hebben we slechts vier onafhankelijke getallen, die we kunnen ordenen in een tabel:

Ziek Gezond Blootgesteld DEHE Niet blootgesteld DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {Diseased }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {Not Exposed}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

Om mogelijke verwarring te voorkomen, benadrukken we dat al deze cijfers verwijzen naar de hele populatie, en niet naar een ervan.

RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

die kan worden herschreven als RR = DENNDNNE = DE / DNNE / NN. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}

OR = DE / HEDN / HN, {\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} die kan worden herschreven als OR = DEHNDNHE = DE / DNHE / HN. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}

Vaak kunnen we dit probleem oplossen door willekeurige steekproeven van de populatie te gebruiken: namelijk, als noch de ziekte, noch de blootstelling aan het letsel te zeldzaam zijn in onze populatie, dan kunnen we (laten we zeggen ) honderd mensen willekeurig, en ontdek deze vier getallen in die steekproef; aangenomen dat de steekproef voldoende representatief is voor de populatie, dan zal de RR die voor deze steekproef is berekend een goede schatting zijn voor de RR voor de hele populatie.

Sommige ziekten kunnen echter zo zeldzaam zijn dat, naar alle waarschijnlijkheid , zelfs een grote willekeurige steekproef bevat misschien niet eens een enkel ziek individu (of het kan er enkele bevatten, maar te weinig om statistisch significant te zijn). Dit zou het onmogelijk maken om de RR te berekenen. Maar we kunnen misschien wel de OR schatten, op voorwaarde dat, in tegenstelling tot de ziekte, de blootstelling aan het kinderletsel niet al te zeldzaam is. Omdat de ziekte zeldzaam is, is dit natuurlijk ook onze schatting voor de RR.

Kijkend naar de uiteindelijke uitdrukking voor de OR: de breuk in de teller, DE / DN, {\ displaystyle D_ { E} / D_ {N},} kunnen we schatten door alle bekende gevallen van de ziekte te verzamelen (vermoedelijk moeten er enkele zijn, anders zouden we het onderzoek waarschijnlijk niet doen), en te zien hoeveel van de zieke mensen hadden de blootstelling, en hoeveel niet. En de fractie in de noemer, HE / HN, {\ displaystyle H_ {E} / H_ {N},} is de kans dat een gezond persoon in de populatie werd blootgesteld kinderletsel. Merk nu op dat deze laatste kans inderdaad kan worden geschat door willekeurige steekproeven van de populatie – op voorwaarde dat, zoals we al zeiden, de prevalentie van de blootstelling aan het kinderletsel niet te klein is, zodat een willekeurige steekproef van een beheersbare grootte bevat waarschijnlijk een behoorlijk aantal personen die de blootstelling hebben gehad. Dus hier is de ziekte zeer zeldzaam, maar de factor dacht eraan bijdragen is niet zo zeldzaam; dergelijke situaties komen in de praktijk vrij vaak voor.

We kunnen dus de OR schatten, en dan, weer een beroep op de aanname van zeldzame ziekten, zeggen we dat dit ook een goede benadering is van de RR. Overigens is het hierboven beschreven scenario een paradigmatisch voorbeeld van een case-control studie.

Definitie in termen van groepsgewijze oddsEdit

De odds ratio is de ratio van de odds van een gebeurtenis die zich voordoet in de ene groep naarmate de kans groot is dat deze zich voordoet in een andere groep. De term wordt ook gebruikt om te verwijzen naar op steekproeven gebaseerde schattingen van deze verhouding. Deze groepen kunnen mannen en vrouwen zijn, een experimentele groep en een controlegroep, of een andere dichotome classificatie.Als de kans op de gebeurtenis in elk van de groepen p1 (eerste groep) en p2 (tweede groep) is, dan is de odds ratio:

p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {P_ {1} / (1-P_ {1}) \ via P_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ over p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}

waarbij qx = 1 – px. Een odds ratio van 1 geeft aan dat de aandoening of gebeurtenis die wordt bestudeerd even waarschijnlijk in beide groepen zal voorkomen. Een odds ratio groter dan 1 geeft aan dat de conditie of gebeurtenis waarschijnlijker is in de eerste groep. En een odds ratio van minder dan 1 geeft aan dat de conditie of gebeurtenis minder waarschijnlijk zal optreden in de eerste groep. De odds ratio moet niet-negatief zijn als deze is gedefinieerd. Het is ongedefinieerd als p2q1 gelijk is aan nul, dat wil zeggen, als p2 gelijk is aan nul of q1 gelijk is aan nul.

Definitie in termen van gezamenlijke en voorwaardelijke waarschijnlijkheden Bewerken

De odds ratio kan ook worden gedefinieerd in termen van de gezamenlijke kansverdeling van twee binaire willekeurige variabelen. De gezamenlijke verdeling van binaire willekeurige variabelen X en Y kan worden geschreven

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

waar p11, p10, p01 en p00 niet-negatieve “celwaarschijnlijkheden” zijn die opgeteld één zijn. De kansen voor Y binnen de twee subpopulaties gedefinieerd door X = 1 en X = 0 worden gedefinieerd in termen van de voorwaardelijke kansen gegeven X, dwz P (Y | X):

Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}

De odds ratio is dus

p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

De eenvoudige uitdrukking aan de rechterkant, hierboven, is gemakkelijk te onthouden als th Het product van de kansen van de “concordante cellen” (X = Y) gedeeld door het product van de waarschijnlijkheden van de “conflicterende cellen” (X ≠ Y). Merk echter op dat in sommige applicaties het labelen van categorieën als nul en één willekeurig is, dus er is niets speciaals aan concordante versus dissonante waarden in deze applicaties.

SymmetryEdit

Als we hadden berekend de odds ratio op basis van de voorwaardelijke kansen gegeven Y,

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

we zouden hetzelfde resultaat hebben behaald

p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}

Andere maten van effectgrootte voor binaire gegevens, zoals het relatieve risico, hebben deze symmetrie-eigenschap niet.

Relatie met statistische onafhankelijkheidEdit

Als X en Y onafhankelijk zijn, kunnen hun gezamenlijke kansen als volgt worden uitgedrukt in termen van hun marginale kansen px = P (X = 1) en py = P (Y = 1)

Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}

In dit geval is de odds ratio gelijk aan één, en omgekeerd kan de odds ratio alleen gelijk zijn aan één als de joint proba Op deze manier kunnen talenten worden meegerekend. Dus de odds ratio is gelijk aan één als en slechts als X en Y onafhankelijk zijn.

Herstel van de celkansen uit de odds ratio en marginale waarschijnlijkheden Bewerken

De odds ratio is een functie van de cel waarschijnlijkheden, en omgekeerd, de celkansen kunnen worden hersteld op basis van kennis van de odds ratio en de marginale waarschijnlijkheden P (X = 1) = p11 + p10 en P (Y = 1) = p11 + p01.Als de odds ratio R verschilt van 1, dan

p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle P_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}

waarbij p1 • = p11 + p10, p • 1 = p11 + p01, en

S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (P_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) P_ {1 \ cdot} p _ {\ cdot 1}}}.}

In het geval waarin R = 1, hebben we onafhankelijkheid, dus p11 = p1 • p • 1.

Zodra we p11 hebben, kunnen de andere drie cellen kansen kunnen gemakkelijk worden hersteld van de marginale kansen.

Write a Comment

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *