Odds ratio (Español)

Un ejemplo motivador, en el contexto del supuesto de enfermedad raraEditar

Imagínese que hay una enfermedad rara que afecta, digamos, a uno de cada muchos miles de adultos en un país. Imagínese que sospechamos que estar expuesto a algo (digamos, haber tenido un tipo particular de lesión en la infancia) aumenta la probabilidad de desarrollar esa enfermedad en la edad adulta. Lo más informativo para calcular sería el índice de riesgo, RR. Para hacer esto, en el caso ideal, para todos los adultos de la población necesitaríamos saber si (a) tuvieron la exposición a la lesión cuando eran niños y (b) si desarrollaron la enfermedad cuando eran adultos. De esto extraeríamos la siguiente información: el número total de personas expuestas a la lesión infantil, NE, {\ displaystyle N_ {E},} de las cuales DE {\ displaystyle D_ {E}} desarrolló la enfermedad y HE {\ displaystyle H_ {E}} se mantuvo saludable; y el número total de personas no expuestas, N N, {\ displaystyle N_ {N},} de las cuales D N {\ displaystyle D_ {N}} desarrollaron la enfermedad y H N {\ displaystyle H_ {N}} se mantuvo saludable. Dado que NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} y de manera similar para los números NN {\ displaystyle N_ {N}}, solo tenemos cuatro números independientes, que podemos organizar en una tabla:

Enfermo Sano Expuesto DEHE No expuesto DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {Enfermo }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {No expuesto}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

Para evitar posibles confusiones, enfatizamos que todos estos números se refieren a toda la población y no a una muestra de él.

RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

que se puede reescribir como RR = DENNDNNE = DE / DNNE / NN. {\ Displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}

OR = DE / HEDN / HN, {\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} que se puede reescribir como OR = DEHNDNHE = DE / DNHE / HN. {\ Displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}

A menudo podemos superar este problema empleando un muestreo aleatorio de la población: es decir, si ni la enfermedad ni la exposición a la lesión son demasiado raras en nuestra población, entonces podemos elegir (digamos ) cien personas al azar, y averigüe estos cuatro números en esa muestra; asumiendo que la muestra es lo suficientemente representativa de la población, entonces el RR calculado para esta muestra será una buena estimación del RR para toda la población.

Sin embargo, algunas enfermedades pueden ser tan raras que, con toda probabilidad , incluso una muestra aleatoria grande puede no contener ni siquiera un solo individuo enfermo (o puede contener algunos, pero muy pocos para ser estadísticamente significativos). Esto haría imposible calcular el RR. Sin embargo, es posible que podamos estimar el OR, siempre que, a diferencia de la enfermedad, la exposición a la lesión infantil no sea demasiado rara. Por supuesto, debido a que la enfermedad es rara, esta es también nuestra estimación para el RR.

Mirando la expresión final para el OR: la fracción en el numerador, DE / DN, {\ displaystyle D_ { E} / D_ {N},} podemos estimar recopilando todos los casos conocidos de la enfermedad (presumiblemente debe haber algunos, o de lo contrario probablemente no estaríamos haciendo el estudio en primer lugar), y viendo cuántos de las personas enfermas tuvieron la exposición, y cuántas no. Y la fracción en el denominador, HE / HN, {\ displaystyle H_ {E} / H_ {N},} es la probabilidad de que una persona sana de la población haya estado expuesta Ahora tenga en cuenta que estas últimas probabilidades se pueden estimar mediante un muestreo aleatorio de la población, siempre y cuando, como dijimos, la prevalencia de la exposición a la lesión infantil no sea demasiado pequeña, de modo que una muestra aleatoria de una Es probable que el tamaño manejable contenga un buen número de personas que han tenido la exposición. Por lo tanto, aquí la enfermedad es muy rara, pero el factor contribuir a ello no es tan raro; tales situaciones son bastante comunes en la práctica.

Por lo tanto, podemos estimar la OR, y luego, invocando nuevamente el supuesto de enfermedad rara, decimos que también es una buena aproximación del RR. Por cierto, el escenario descrito anteriormente es un ejemplo paradigmático de un estudio de casos y controles.

Definición en términos de probabilidades de grupoEditar

La razón de probabilidades es la razón de las probabilidades de un evento que ocurre en un grupo a las probabilidades de que ocurra en otro grupo. El término también se utiliza para referirse a estimaciones basadas en muestras de esta relación. Estos grupos pueden ser hombres y mujeres, un grupo experimental y un grupo de control, o cualquier otra clasificación dicotómica.Si las probabilidades del evento en cada uno de los grupos son p1 (primer grupo) y p2 (segundo grupo), entonces la razón de posibilidades es:

p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {p_ {1} / (1-p_ {1}) \ over p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ over p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}

donde qx = 1 – px. Una razón de probabilidades de 1 indica que la afección o el evento en estudio tiene la misma probabilidad de ocurrir en ambos grupos. Una razón de probabilidades mayor que 1 indica que es más probable que la afección o el evento ocurra en el primer grupo. Y una razón de probabilidades menor a 1 indica que es menos probable que la afección o el evento ocurra en el primer grupo. La razón de posibilidades no debe ser negativa si está definida. No está definido si p2q1 es igual a cero, es decir, si p2 es igual a cero o q1 es igual a cero.

Definición en términos de probabilidades conjuntas y condicionalesEditar

La razón de posibilidades también se puede definir en términos de la distribución de probabilidad conjunta de dos variables aleatorias binarias. La distribución conjunta de las variables aleatorias binarias X e Y se puede escribir

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

donde p11, p10, p01 y p00 son «probabilidades de celda» no negativas que suman uno. Las probabilidades de Y dentro de las dos subpoblaciones definidas por X = 1 y X = 0 se definen en términos de las probabilidades condicionales dadas X, es decir, P (Y | X):

Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}

Por tanto, la razón de posibilidades es

p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ Displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

La expresión simple de la derecha, arriba, es fácil de recordar como th e producto de las probabilidades de las «celdas concordantes» (X = Y) dividido por el producto de las probabilidades de las «celdas discordantes» (X ≠ Y). Sin embargo, tenga en cuenta que en algunas aplicaciones el etiquetado de categorías como cero y uno es arbitrario, por lo que no hay nada especial en los valores concordantes y discordantes en estas aplicaciones.

SymmetryEdit

Si hubiéramos calculado la razón de posibilidades basada en las probabilidades condicionales dadas Y,

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

hubiéramos obtenido el mismo resultado

p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ Displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}

Otras medidas del tamaño del efecto para datos binarios, como el riesgo relativo, no tienen esta propiedad de simetría.

Relación con estadísticas independenciaEditar

Si X e Y son independientes, sus probabilidades conjuntas se pueden expresar en términos de sus probabilidades marginales px = P (X = 1) y py = P (Y = 1), de la siguiente manera

Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}

En este caso , la razón de probabilidades es igual a uno y, a la inversa, la razón de probabilidades solo puede ser igual a uno si la probabilidad conjunta las bilidades se pueden factorizar de esta manera. Por lo tanto, la razón de probabilidades es igual a uno si y solo si X e Y son independientes.

Recuperación de las probabilidades de la celda a partir de la razón de probabilidades y las probabilidades marginalesEditar

La razón de probabilidades es una función de la celda probabilidades y, a la inversa, las probabilidades de la celda se pueden recuperar teniendo en cuenta la razón de posibilidades y las probabilidades marginales P (X = 1) = p11 + p10 y P (Y = 1) = p11 + p01.Si la razón de posibilidades R es diferente de 1,

p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}

donde p1 • = p11 + p10, p • 1 = p11 + p01, y

S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ Displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}

En el caso donde R = 1, tenemos independencia, entonces p11 = p1 • p • 1.

Una vez que tenemos p11, las otras tres celdas las probabilidades se pueden recuperar fácilmente de las probabilidades marginales.

Write a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *