Um exemplo motivador, no contexto da suposição de doença rara Editar
Imagine que existe uma doença rara que aflige, digamos, apenas uma em muitos milhares de adultos em um país. Imagine que suspeitamos que ser exposto a algo (digamos, ter sofrido um tipo específico de lesão na infância) aumenta a probabilidade de alguém desenvolver essa doença na idade adulta. A coisa mais informativa para calcular seria a razão de risco, RR. Para fazer isso no caso ideal, para todos os adultos da população, precisaríamos saber se eles (a) tiveram a exposição à lesão quando crianças e (b) se desenvolveram a doença quando adultos. Disto, extrairíamos as seguintes informações: o número total de pessoas expostas à lesão infantil, NE, {\ displaystyle N_ {E},} dos quais DE {\ displaystyle D_ {E}} desenvolveu a doença e HE {\ displaystyle H_ {E}} permaneceu saudável; e o número total de pessoas não expostas, N N, {\ displaystyle N_ {N},} das quais D N {\ displaystyle D_ {N}} desenvolveu a doença e H N {\ displaystyle H_ {N}} permaneceu saudável. Dado que NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} e da mesma forma para os números NN {\ displaystyle N_ {N}}, só temos quatro números independentes, que podemos organizar em uma tabela:
Diseased Healthy Exposed DEHE Não exposto DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {Diseased }} & {\ text {Saudável}} \\\ hline {\ text {Exposto}} & {D_ {E}} & {H_ {E}} \\ {\ text {Não exposto}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}
Para evitar possíveis confusões, enfatizamos que todos esses números se referem a toda a população, e não a alguma amostra dele.
RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}
que pode ser reescrito como RR = DENNDNNE = DE / DNNE / NN. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}
OU = DE / HEDN / HN, {\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} que pode ser reescrito como OR = DEHNDNHE = DE / DNHE / HN. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}
Freqüentemente, podemos superar esse problema empregando uma amostra aleatória da população: ou seja, se nem a doença nem a exposição à lesão forem muito raras em nossa população, então podemos escolher (digamos ) cem pessoas aleatoriamente e descobrir esses quatro números nessa amostra; assumindo que a amostra é representativa o suficiente da população, então o RR calculado para esta amostra será uma boa estimativa para o RR para toda a população.
No entanto, algumas doenças podem ser tão raras que, com toda a probabilidade , mesmo uma grande amostra aleatória pode não conter nem mesmo um único indivíduo doente (ou pode conter alguns, mas muito poucos para ser estatisticamente significativa). Isso tornaria impossível calcular o RR. Mas, mesmo assim, podemos estimar o OR, desde que, ao contrário da doença, a exposição à lesão infantil não seja muito rara. Obviamente, como a doença é rara, esta é também nossa estimativa para o RR.
Olhando para a expressão final do OR: a fração no numerador, DE / DN, {\ displaystyle D_ { E} / D_ {N},} podemos estimar coletando todos os casos conhecidos da doença (presumivelmente deve haver alguns, ou então provavelmente não estaríamos fazendo o estudo em primeiro lugar) e vendo quantos de as pessoas doentes tiveram a exposição, e quantas não. E a fração no denominador, HE / HN, {\ displaystyle H_ {E} / H_ {N},} é a probabilidade de um indivíduo saudável na população ter sido exposto à lesão infantil. Agora, observe que esta última probabilidade pode de fato ser estimada por amostragem aleatória da população – desde, como dissemos, que a prevalência da exposição à lesão infantil não seja muito pequena, de modo que uma amostra aleatória tamanho controlável provavelmente conteria um número razoável de indivíduos que foram expostos. Portanto, aqui a doença é muito rara, mas o fator pensou contribuir para isso não é tão raro; tais situações são bastante comuns na prática.
Assim, podemos estimar o OR, e então, invocando a hipótese de doença rara novamente, dizemos que esta também é uma boa aproximação do RR. A propósito, o cenário descrito acima é um exemplo paradigmático de um estudo de caso-controle.
Definição em termos de oddsEdit de grupo
O odds ratio é a razão entre as chances de um evento ocorrendo em um grupo com a probabilidade de ocorrer em outro grupo. O termo também é usado para se referir a estimativas dessa proporção com base em amostras. Esses grupos podem ser homens e mulheres, um grupo experimental e um grupo de controle ou qualquer outra classificação dicotômica.Se as probabilidades do evento em cada um dos grupos forem p1 (primeiro grupo) e p2 (segundo grupo), então a razão de chances é:
p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {p_ {1} / (1-p_ {1}) \ over p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ over p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}
onde qx = 1 – px. Um odds ratio de 1 indica que a condição ou evento em estudo é igualmente provável de ocorrer em ambos os grupos. Um odds ratio maior que 1 indica que a condição ou evento é mais provável de ocorrer no primeiro grupo. E um odds ratio menor que 1 indica que a condição ou evento é menos provável de ocorrer no primeiro grupo. O odds ratio deve ser não negativo se for definido. É indefinido se p2q1 é igual a zero, ou seja, se p2 é igual a zero ou q1 é igual a zero.
Definição em termos de probabilidades conjuntas e condicionais Editar
O odds ratio também pode ser definido em termos da distribuição de probabilidade conjunta de duas variáveis aleatórias binárias. A distribuição conjunta das variáveis aleatórias binárias X e Y pode ser escrita
Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}
onde p11, p10, p01 e p00 são “probabilidades de célula” não negativas que somam um. As probabilidades de Y nas duas subpopulações definidas por X = 1 e X = 0 são definidas em termos das probabilidades condicionais dadas X, ou seja, P (Y | X):
Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}
Assim, o odds ratio é
p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}
A expressão simples à direita, acima, é fácil de lembrar como o O produto das probabilidades das “células concordantes” (X = Y) dividido pelo produto das probabilidades das “células discordantes” (X ≠ Y). No entanto, observe que em alguns aplicativos a rotulagem de categorias como zero e um é arbitrária, então não há nada de especial sobre valores concordantes versus discordantes nesses aplicativos.
SymmetryEdit
Se tivéssemos calculado o odds ratio com base nas probabilidades condicionais dadas Y,
Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}
teríamos obtido o mesmo resultado
p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}
Outras medidas de tamanho do efeito para dados binários, como o risco relativo, não têm essa propriedade de simetria.
Relação com estatísticas IndependentEdit
Se X e Y são independentes, suas probabilidades conjuntas podem ser expressas em termos de suas probabilidades marginais px = P (X = 1) e py = P (Y = 1), como segue
Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}
Neste caso , o odds ratio é igual a um e, inversamente, o odds ratio só pode ser igual a um se o proba conjunto As capacidades podem ser fatoradas dessa maneira. Assim, o odds ratio é igual a um se e somente se X e Y forem independentes.
Recuperando as probabilidades da célula a partir do odds ratio e das probabilidades marginaisEditar
O odds ratio é uma função da célula probabilidades e, inversamente, as probabilidades das células podem ser recuperadas dado o conhecimento da razão de chances e das probabilidades marginais P (X = 1) = p11 + p10 e P (Y = 1) = p11 + p01.Se o odds ratio R difere de 1, então
p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}
onde p1 • = p11 + p10, p • 1 = p11 + p01, e
S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}
No caso em que R = 1, temos independência, então p11 = p1 • p • 1.
Assim que tivermos p11, as outras três células as probabilidades podem ser facilmente recuperadas das probabilidades marginais.