Odds Ratio (Deutsch)

Ein motivierendes Beispiel im Zusammenhang mit der Annahme einer seltenen KrankheitEdit

Stellen Sie sich vor, es gibt eine seltene Krankheit, von der beispielsweise nur einer von vielen Tausenden Erwachsenen betroffen ist ein Land. Stellen Sie sich vor, wir vermuten, dass die Wahrscheinlichkeit, dass man diese Krankheit im Erwachsenenalter entwickelt, wenn man etwas ausgesetzt ist (z. B. wenn man in der Kindheit eine bestimmte Art von Verletzung hatte). Am informativsten wäre das Risikoverhältnis RR. Um dies im Idealfall zu tun, müssten wir für alle Erwachsenen in der Bevölkerung wissen, ob sie (a) als Kinder der Verletzung ausgesetzt waren und (b) ob sie die Krankheit als Erwachsene entwickelten. Daraus würden wir die folgenden Informationen extrahieren: die Gesamtzahl der Personen, die der Verletzung im Kindesalter ausgesetzt waren, NE, {\ displaystyle N_ {E},} aus denen DE {\ displaystyle D_ {E}} die Krankheit entwickelte und HE {\ Anzeigestil H_ {E}} blieb gesund; und die Gesamtzahl der nicht exponierten Personen, N N, {\ displaystyle N_ {N},} aus denen D N {\ displaystyle D_ {N}} die Krankheit entwickelte und H N {\ displaystyle H_ {N}} gesund blieb. Da NE = DE + HE {\ Anzeigestil N_ {E} = D_ {E} + H_ {E}} und ähnlich für die NN {\ Anzeigestil N_ {N}} Nummern, haben wir nur vier unabhängige Nummern, die wir organisieren können in einer Tabelle:

krank gesund ausgesetzt DEHE nicht exponiert DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {krank }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {Nicht verfügbar}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

Um mögliche Verwirrung zu vermeiden, betonen wir, dass sich alle diese Zahlen auf die gesamte Population beziehen und nicht auf eine Stichprobe davon.

RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

kann umgeschrieben werden als RR = DENNDNNE = DE / DNNE / NN. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}

OR = DE / HEDN / HN, {\ Anzeigestil OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,}, das als OR = DEHNDNHE = DE / DNHE / HN umgeschrieben werden kann. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}

Oft können wir dieses Problem durch eine zufällige Stichprobe der Bevölkerung überwinden: Wenn weder die Krankheit noch die Exposition gegenüber der Verletzung in unserer Bevölkerung zu selten sind, können wir auswählen (sagen wir) ) hundert zufällige Personen, und finden Sie diese vier Zahlen in dieser Stichprobe heraus; Unter der Annahme, dass die Stichprobe repräsentativ genug für die Bevölkerung ist, ist die für diese Stichprobe berechnete RR eine gute Schätzung für die RR für die gesamte Bevölkerung.

Einige Krankheiten können jedoch aller Wahrscheinlichkeit nach so selten sein, dass Selbst eine große Zufallsstichprobe enthält möglicherweise nicht einmal eine einzige erkrankte Person (oder einige, aber zu wenige, um statistisch signifikant zu sein). Dies würde es unmöglich machen, die RR zu berechnen. Möglicherweise können wir den OP dennoch abschätzen, vorausgesetzt, dass die Exposition gegenüber Verletzungen bei Kindern im Gegensatz zur Krankheit nicht allzu selten ist. Da die Krankheit selten ist, ist dies natürlich auch unsere Schätzung für die RR.

Betrachtet man den endgültigen Ausdruck für den OP: den Bruch im Zähler, DE / DN, {\ displaystyle D_ { E} / D_ {N},} können wir abschätzen, indem wir alle bekannten Fälle der Krankheit sammeln (vermutlich muss es einige geben, sonst würden wir die Studie wahrscheinlich gar nicht erst durchführen) und sehen, wie viele davon Die kranken Menschen hatten die Exposition und wie viele nicht. Und der Anteil im Nenner HE / HN, {\ displaystyle H_ {E} / H_ {N},} ist die Wahrscheinlichkeit, dass ein gesundes Individuum in der Bevölkerung exponiert wurde Beachten Sie nun, dass diese letztgenannten Chancen tatsächlich durch Zufallsstichproben der Bevölkerung geschätzt werden können – vorausgesetzt, wie gesagt, dass die Prävalenz der Exposition gegenüber der Kinderverletzung nicht zu gering ist, so dass eine Zufallsstichprobe von a Eine überschaubare Größe würde wahrscheinlich eine angemessene Anzahl von Personen enthalten, die der Exposition ausgesetzt waren. Hier ist die Krankheit also sehr selten, aber der Faktor dachte dazu beizutragen ist nicht ganz so selten; Solche Situationen sind in der Praxis recht häufig.

Somit können wir den OP abschätzen und dann, wenn wir uns erneut auf die Annahme einer seltenen Krankheit berufen, sagen, dass dies auch eine gute Annäherung an die RR ist. Das oben beschriebene Szenario ist übrigens ein paradigmatisches Beispiel für eine Fall-Kontroll-Studie.

Definition in Bezug auf gruppenweise OddsEdit

Das Odds Ratio ist das Verhältnis der Odds of a Ereignis in einer Gruppe zu der Wahrscheinlichkeit, dass es in einer anderen Gruppe auftritt. Der Begriff wird auch verwendet, um stichprobenbasierte Schätzungen dieses Verhältnisses zu bezeichnen. Diese Gruppen können Männer und Frauen, eine Versuchsgruppe und eine Kontrollgruppe oder eine andere dichotome Klassifikation sein.Wenn die Wahrscheinlichkeiten des Ereignisses in jeder der Gruppen p1 (erste Gruppe) und p2 (zweite Gruppe) sind, beträgt das Quotenverhältnis:

p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ Anzeigestil {p_ {1} / (1-p_ {1}) \ über p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ über p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}

wobei qx = 1 – px. Ein Odds Ratio von 1 zeigt an, dass der untersuchte Zustand oder das untersuchte Ereignis in beiden Gruppen gleich wahrscheinlich ist. Ein Odds Ratio größer als 1 zeigt an, dass die Bedingung oder das Ereignis in der ersten Gruppe eher auftritt. Ein Quotenverhältnis von weniger als 1 zeigt an, dass die Bedingung oder das Ereignis in der ersten Gruppe weniger wahrscheinlich ist. Das Odds Ratio darf nicht negativ sein, wenn es definiert ist. Es ist nicht definiert, ob p2q1 gleich Null ist, dh wenn p2 gleich Null ist oder q1 gleich Null ist.

Definition in Bezug auf gemeinsame und bedingte WahrscheinlichkeitenEdit

Das Odds Ratio kann auch in Begriffen definiert werden der gemeinsamen Wahrscheinlichkeitsverteilung zweier binärer Zufallsvariablen. Die gemeinsame Verteilung der binären Zufallsvariablen X und Y kann geschrieben werden.

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

wobei p11, p10, p01 und p00 nicht negative „Zellwahrscheinlichkeiten“ sind, die sich zu eins summieren. Die Chancen für Y innerhalb der beiden durch X = 1 und X = 0 definierten Teilpopulationen werden als bedingte Wahrscheinlichkeiten definiert, denen X gegeben ist, dh P (Y | X): Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}} \ end {array}}}

Somit ist das Quotenverhältnis

p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

Der einfache Ausdruck rechts oben ist leicht als th zu merken Das Produkt der Wahrscheinlichkeiten der „konkordanten Zellen“ (X = Y) geteilt durch das Produkt der Wahrscheinlichkeiten der „nicht übereinstimmenden Zellen“ (X ≠ Y). Beachten Sie jedoch, dass in einigen Anwendungen die Kennzeichnung von Kategorien als Null und Eins willkürlich ist, sodass konkordante und nicht übereinstimmende Werte in diesen Anwendungen nichts Besonderes sind.

SymmetryEdit

Wenn wir berechnet hätten das Odds Ratio basiert auf den bedingten Wahrscheinlichkeiten bei Y,

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

wir hätten das gleiche Ergebnis erhalten

p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}

Andere Maße der Effektgröße für Binärdaten wie das relative Risiko haben diese Symmetrieeigenschaft nicht.

Beziehung zur Statistik IndependenceEdit

Wenn X und Y unabhängig sind, können ihre gemeinsamen Wahrscheinlichkeiten wie folgt in Form ihrer Grenzwahrscheinlichkeiten px = P (X = 1) und py = P (Y = 1) ausgedrückt werden

Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}

In diesem Fall ist das Odds Ratio gleich eins, und umgekehrt kann das Odds Ratio nur eins sein, wenn die gemeinsame Probe Fähigkeiten können auf diese Weise berücksichtigt werden. Somit ist das Odds Ratio genau dann gleich eins, wenn X und Y unabhängig sind.

Wiederherstellen der Zellwahrscheinlichkeiten aus dem Odds Ratio und den GrenzwahrscheinlichkeitenEdit

Das Odds Ratio ist eine Funktion der Zelle Wahrscheinlichkeiten und umgekehrt können die Zellwahrscheinlichkeiten bei Kenntnis des Odds Ratio und der Grenzwahrscheinlichkeiten P (X = 1) = p11 + p10 und P (Y = 1) = p11 + p01 wiederhergestellt werden.Wenn sich das Quotenverhältnis R von 1 unterscheidet, ist

p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}

wobei p1 • = p11 + p10, p • 1 = p11 + p01 und

S = (1 + (p 1 ≤ + p ≤ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ≤ p ≤ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}

In dem Fall, in dem R = 1 ist, haben wir Unabhängigkeit, also p11 = p1 • p • 1.

Sobald wir p11 haben, die anderen drei Zellen Wahrscheinlichkeiten können leicht aus den Grenzwahrscheinlichkeiten wiederhergestellt werden.

Write a Comment

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.