Odds ratio (Français)

Un exemple motivant, dans le contexte de l’hypothèse d’une maladie rareModifier

Imaginez qu’il existe une maladie rare, affectant, par exemple, seulement un adulte sur des milliers un pays. Imaginez que nous soupçonnions que le fait d’être exposé à quelque chose (par exemple, avoir eu une sorte de blessure particulière dans l’enfance) rend plus susceptible de développer cette maladie à l’âge adulte. La chose la plus informative à calculer serait le ratio de risque, RR. Pour ce faire, dans le cas idéal, pour tous les adultes de la population, nous aurions besoin de savoir s’ils (a) ont été exposés à la blessure dans leur enfance et (b) s’ils ont développé la maladie à l’âge adulte. À partir de là, nous extrairions les informations suivantes: le nombre total de personnes exposées à la blessure infantile, NE, {\ displaystyle N_ {E},} dont DE {\ displaystyle D_ {E}} a développé la maladie et HE {\ displaystyle H_ {E}} est resté sain; et le nombre total de personnes non exposées, N N, {\ displaystyle N_ {N}}, dont D N {\ displaystyle D_ {N}} ont développé la maladie et H N {\ displaystyle H_ {N}} est resté en bonne santé. Puisque NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} et de même pour les nombres NN {\ displaystyle N_ {N}}, nous n’avons que quatre nombres indépendants, que nous pouvons organiser dans un tableau:

Diseased Healthy Exposed DEHE Non exposé DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {Diseased }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {Non exposé}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

Pour éviter toute confusion possible, nous soulignons que tous ces nombres se réfèrent à la population entière, et non à un échantillon .

RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

qui peut être réécrit comme RR = DENNDNNE = DE / DNNE / NN. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}

OR = DE / HEDN / HN, {\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} qui peut être réécrit comme OR = DEHNDNHE = DE / DNHE / HN. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}

Souvent, nous pouvons surmonter ce problème en utilisant un échantillonnage aléatoire de la population: à savoir, si ni la maladie ni l’exposition à la blessure ne sont trop rares dans notre population, alors nous pouvons choisir (disons ) une centaine de personnes au hasard, et découvrez ces quatre nombres dans cet échantillon; en supposant que l’échantillon soit suffisamment représentatif de la population, alors le RR calculé pour cet échantillon sera une bonne estimation du RR pour l’ensemble de la population.

Cependant, certaines maladies peuvent être si rares que, selon toute vraisemblance , même un grand échantillon aléatoire peut ne pas contenir même un seul individu malade (ou il peut en contenir, mais trop peu pour être statistiquement significatif). Cela rendrait impossible le calcul du RR. Mais, nous pouvons néanmoins être en mesure d’estimer le RO, à condition que, contrairement à la maladie, l’exposition à la blessure infantile ne soit pas trop rare. Bien sûr, parce que la maladie est rare, c’est alors aussi notre estimation pour le RR.

En regardant l’expression finale du OR: la fraction au numérateur, DE / DN, {\ displaystyle D_ { E} / D_ {N},} nous pouvons estimer en collectant tous les cas connus de la maladie (vraisemblablement il doit y en avoir, sinon nous ne ferions probablement pas l’étude en premier lieu), et en voyant combien de les personnes malades ont été exposées, et combien n’en ont pas eu. Et la fraction du dénominateur, HE / HN, {\ displaystyle H_ {E} / H_ {N},} est la probabilité qu’un individu en bonne santé de la population soit exposé Notons maintenant que cette dernière cote peut en effet être estimée par échantillonnage aléatoire de la population – à condition, comme nous l’avons dit, que la prévalence de l’exposition à la blessure infantile ne soit pas trop faible, de sorte qu’un échantillon aléatoire d’un une taille gérable contiendrait probablement un bon nombre d’individus qui ont été exposés. Donc, ici, la maladie est très rare, mais le facteur pensait y contribuer n’est pas si rare; de telles situations sont assez courantes en pratique.

Ainsi, nous pouvons estimer le OR, puis, en invoquant à nouveau l’hypothèse de maladie rare, nous disons que c’est aussi une bonne approximation du RR. Soit dit en passant, le scénario décrit ci-dessus est un exemple paradigmatique d’une étude cas-témoins.

Définition en termes d’oddsEdit par groupe

L’odds ratio est le ratio des chances d’un événement survenant dans un groupe aux chances qu’il se produise dans un autre groupe. Le terme est également utilisé pour désigner les estimations fondées sur un échantillon de ce ratio. Ces groupes peuvent être des hommes et des femmes, un groupe expérimental et un groupe témoin, ou toute autre classification dichotomique.Si les probabilités de l’événement dans chacun des groupes sont p1 (premier groupe) et p2 (deuxième groupe), alors le rapport de cotes est:

p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ Displaystyle {p_ {1} / (1-p_ {1}) \ over p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ over p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}

où qx = 1 – px. Un rapport de cotes de 1 indique que la condition ou l’événement à l’étude est également susceptible de se produire dans les deux groupes. Un rapport de cotes supérieur à 1 indique que la condition ou l’événement est plus susceptible de se produire dans le premier groupe. Et un rapport de cotes inférieur à 1 indique que la condition ou l’événement est moins susceptible de se produire dans le premier groupe. L’odds ratio doit être non négatif s’il est défini. Il n’est pas défini si p2q1 est égal à zéro, c’est-à-dire si p2 est égal à zéro ou q1 est égal à zéro.

Définition en termes de probabilités conjointes et conditionnelles Modifier

L’odds ratio peut également être défini en termes de la distribution de probabilité conjointe de deux variables aléatoires binaires. La distribution conjointe des variables aléatoires binaires X et Y peut s’écrire

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

où p11, p10, p01 et p00 sont des « probabilités de cellule » non négatives qui totalisent un. Les cotes pour Y au sein des deux sous-populations définies par X = 1 et X = 0 sont définies en termes de probabilités conditionnelles données X, c’est-à-dire P (Y | X):

Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}

Ainsi l’odds ratio est

p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

L’expression simple à droite, ci-dessus, est facile à retenir car e Le produit des probabilités des « cellules concordantes » (X = Y) divisé par le produit des probabilités des « cellules discordantes » (X ≠ Y). Cependant, notez que dans certaines applications, l’étiquetage des catégories comme zéro et un est arbitraire, il n’y a donc rien de spécial à propos des valeurs concordantes ou discordantes dans ces applications.

SymmetryEdit

Si nous avions calculé l’odds ratio basé sur les probabilités conditionnelles données Y,

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

nous aurions obtenu le même résultat

p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}

D’autres mesures de la taille de l’effet pour des données binaires telles que le risque relatif n’ont pas cette propriété de symétrie.

Relation avec statistique indépendanceEdit

Si X et Y sont indépendants, leurs probabilités conjointes peuvent être exprimées en termes de leurs probabilités marginales px = P (X = 1) et py = P (Y = 1), comme suit

Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}

Dans ce cas , l’odds ratio est égal à un, et inversement l’odds ratio ne peut être égal à un que si les capacités peuvent être prises en compte de cette manière. Ainsi, le rapport de cotes vaut un si et seulement si X et Y sont indépendants.

Récupération des probabilités de cellule à partir du rapport de cotes et des probabilités marginales Modifier

Le rapport de cotes est une fonction de la cellule probabilités, et inversement, les probabilités cellulaires peuvent être récupérées compte tenu de la connaissance du rapport de cotes et des probabilités marginales P (X = 1) = p11 + p10 et P (Y = 1) = p11 + p01.Si le rapport de cotes R diffère de 1, alors

p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}

où p1 • = p11 + p10, p • 1 = p11 + p01, et

S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}

Dans le cas où R = 1, nous avons l’indépendance, donc p11 = p1 • p • 1.

Une fois que nous avons p11, les trois autres cellules les probabilités peuvent être facilement récupérées à partir des probabilités marginales.

Write a Comment

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *