オッズ比

希少疾患の仮定の文脈での動機付けの例編集

たとえば、数千人の成人のうち1人だけが苦しんでいる希少疾患があると想像してください。国。何かにさらされると(たとえば、小児期に特定の種類の怪我をした)、成人期にその病気を発症する可能性が高くなると思われると想像してみてください。計算するのに最も有益なことは、リスク比RRです。理想的なケースでこれを行うには、母集団のすべての成人について、(a)子供の頃に怪我をしたかどうか、(b)成人として病気を発症したかどうかを知る必要があります。これから、次の情報を抽出します。小児期の怪我にさらされた人々の総数、NE、{\ displaystyle N_ {E}、}、そのうちDE {\ displaystyle D_ {E}}が病気を発症し、HE {\ displaystyle H_ {E}}は健康を維持しました。曝露されなかった人の総数NN、{\ displaystyle N_ {N}、}のうち、D N {\ displaystyle D_ {N}}が病気を発症し、H N {\ displaystyle H_ {N}}は健康を維持しました。 NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}}であり、同様にNN {\ displaystyle N_ {N}}番号の場合、4つの独立した番号しかなく、整理できます。表内:

病気の健康な曝露DEHE曝露されていないDNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {病気}} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {非公開}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

混乱を避けるために、これらの数値はすべて、一部のサンプルではなく、母集団全体を参照していることを強調します。

RR = DE / NEDN / NN、{\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

これはRR = DENNDNNE = DE / DNNE / NNとして書き換えることができます。 {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}。}

OR = DE / HEDN / HN、{\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,}これは、OR = DEHNDNHE = DE / DNHE / HNと書き換えることができます。 {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}。}

母集団のランダムサンプリングを採用することで、この問題を克服できることがよくあります。つまり、母集団で病気や怪我への曝露があまりにもまれでない場合は、選択できます(たとえば、 )ランダムに100人、そのサンプルでこれら4つの数字を見つけます。サンプルが母集団を十分に代表していると仮定すると、このサンプルに対して計算されたRRは、母集団全体のRRの適切な推定値になります。

ただし、一部の疾患は非常にまれであるため、おそらく、大きなランダムサンプルでさえ、単一の罹患した個体さえ含まない場合があります(または、含まれる場合もありますが、統計的に有意であるには少なすぎます)。これにより、RRを計算できなくなります。しかし、それでも、病気とは異なり、小児期の傷害への曝露がそれほどまれでない限り、ORを推定できる可能性があります。もちろん、この病気はまれであるため、これはRRの推定値でもあります。

ORの最終的な式を見ると、分子の分数、DE / DN、{\ displaystyle D_ { E} / D_ {N}、}病気の既知のすべての症例を収集し(おそらくいくつかあるはずです。そうでなければ、そもそも研究を行わない可能性があります)、その数を確認することで推定できます。罹患した人々は曝露を受け、何人が曝露されなかったのか。そして分母の割合、HE / HN、{\ displaystyle H_ {E} / H_ {N}、}は、集団内の健康な個人が曝露された確率です。ここで、この後者の確率は、人口のランダムなサンプリングによって実際に推定できることに注意してください。ただし、前述のように、小児期の傷害への曝露の有病率は小さすぎないため、管理可能なサイズには、曝露を受けたかなりの数の個人が含まれる可能性が高いため、ここではこの病気は非常にまれですが、要因はそれに貢献することはそれほど珍しいことではありません。このような状況は実際には非常に一般的です。

したがって、ORを推定し、まれな病気の仮定を再度呼び出すと、これもRRの適切な近似値であると言えます。ちなみに、上記のシナリオはケースコントロール研究の典型的な例です。

グループごとのオッズによる定義編集

オッズ比は、オッズ比です。あるグループで発生するイベントと、別のグループで発生するオッズ。この用語は、この比率のサンプルベースの推定値を指すためにも使用されます。これらのグループは、男性と女性、実験グループと対照グループ、またはその他の二分分類である可能性があります。各グループのイベントの確率がp1(最初のグループ)とp2(2番目のグループ)の場合、オッズ比は次のようになります。

p 1 /(1 − p 1)p 2 /(1 − p 2)= p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1、{\ displaystyle {p_ {1} /(1-p_ {1})\ over p_ {2} /(1- p_ {2})} = {p_ {1} / q_ {1} \ over p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}}、}

ここで、qx = 1 −px。オッズ比1は、調査中の状態またはイベントが両方のグループで等しく発生する可能性が高いことを示します。オッズ比が1より大きい場合は、条件またはイベントが最初のグループで発生する可能性が高いことを示します。また、オッズ比が1未満の場合は、最初のグループで状態またはイベントが発生する可能性が低いことを示します。オッズ比が定義されている場合、それは非負でなければなりません。 p2q1がゼロに等しいかどうか、つまりp2がゼロに等しいかq1がゼロに等しいかどうかは定義されていません。

同時確率と条件付き確率による定義編集

オッズ比は次の用語でも定義できます。 2つのバイナリ確率変数の同時確率分布の。バイナリ確率変数XとYの同時分布は次のように記述できます

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

ここで、p11、p10、p01、およびp00は、合計が1になる非負の「セル確率」です。 X = 1とX = 0で定義される2つの部分母集団内のYのオッズは、Xが与えられた条件付き確率、つまりP(Y | X)で定義されます。

Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}

したがって、オッズ比は

p 11 /(p 11 + p 10)p 10 /(p 11 + p 10)/ p 01 /(p 01 + p 00)p 00 /(p 01 + p 00)= p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} /(p_ {11} + p_ {10})} {p_ {10} /(p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} /(p_ {01 } + p_ {00})} {p_ {00} /(p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

上の右側の単純な式は、次のように覚えやすいです。 「一致セル」(X = Y)の確率の積を「不一致セル」(X≠Y)の確率の積で割ったもの。ただし、一部のアプリケーションでは、カテゴリの0と1のラベル付けは任意であるため、これらのアプリケーションの一致値と不一致値について特別なことは何もありません。

SymmetryEdit

計算した場合Yが与えられた条件付き確率に基づくオッズ比

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

同じ結果が得られたでしょう

p 11 /(p 11 + p 01)p 01 /(p 11 + p 01)/ p 10 /(p 10 + p 00)p 00 /(p 10 + p 00)= p 11 p 00 p 10 p01。 {\ displaystyle {{\ dfrac {p_ {11} /(p_ {11} + p_ {01})} {p_ {01} /(p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} /(p_ {10} + p_ {00})} {p_ {00} /(p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}。}

相対リスクなどのバイナリデータの効果量の他の測定値には、この対称性はありません。

統計との関係independenceEdit

XとYが独立している場合、それらの同時確率は、次のように、限界確率px = P(X = 1)およびpy = P(Y = 1)で表すことができます。

Y = 1 Y = 0 X = 1 pxpypx(1 − py)X = 0(1 − px)py(1 − px)(1 − py){\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x}(1-p_ {y})\\ X = 0 &(1- p_ {x})p_ {y} &(1-p_ {x})(1-p_ {y})\ end {array}}}

この場合、オッズ比は1に等しく、逆に、同時確率の場合、オッズ比は1にしか等しくなりません。能力はこの方法で因数分解することができます。したがって、XとYが独立している場合に限り、オッズ比は1に等しくなります。

オッズ比と周辺確率からセル確率を復元する編集

オッズ比はセルの関数です確率、および逆に、オッズ比と周辺確率P(X = 1)= p11 + p10およびP(Y = 1)= p11 + p01の知識があれば、セル確率を回復できます。オッズ比Rが1と異なる場合、

p 11 = 1 +(p1⋅+p⋅1)(R − 1)− S 2(R − 1){\ displaystyle p_ {11} = { \ frac {1+(p_ {1 \ cdot} + p _ {\ cdot 1})(R-1)-S} {2(R-1)}}}

ここで、p1•= p11 + p10、p •1 = p11 + p01、および

S =(1 +(p1⋅+p⋅1)(R − 1))2 + 4 R(1 − R)p1⋅p⋅1。 {\ displaystyle S = {\ sqrt {(1+(p_ {1 \ cdot} + p _ {\ cdot 1})(R-1))^ {2} + 4R(1-R)p_ {1 \ cdot} p _ {\ cdot1}}}。}

R = 1の場合、独立性があるため、p11 = p1•p•1。

p11を取得すると、他の3つのセル 確率は周辺確率から簡単に回復できます。

Write a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です