Odds-forhold

Et motiverende eksempel i forbindelse med den sjældne sygdomsantagelse Rediger

Forestil dig, at der er en sjælden sygdom, der f.eks. Kun rammer en ud af mange tusinde voksne i et land. Forestil dig, at vi har mistanke om, at det at være udsat for noget (for eksempel at have haft en særlig form for skade i barndommen) gør det mere sandsynligt, at man udvikler denne sygdom i voksenalderen. Den mest informative ting at beregne ville være risikoforholdet, RR. For at gøre dette i det ideelle tilfælde ville vi for alle voksne i befolkningen have brug for at vide, om de (a) havde udsat for skaden som børn, og (b) om de udviklede sygdommen som voksne. Herfra ville vi udtrække følgende oplysninger: det samlede antal mennesker udsat for barndomsskaden, NE, {\ displaystyle N_ {E},} hvoraf DE {\ displaystyle D_ {E}} udviklede sygdommen og HE {\ displaystyle H_ {E}} forblev sund; og det samlede antal mennesker, der ikke blev eksponeret, N N, {\ displaystyle N_ {N},} hvoraf D N {\ displaystyle D_ {N}} udviklede sygdommen og H N {\ displaystyle H_ {N}} forblev sund. Da NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} og tilsvarende for NN {\ displaystyle N_ {N}} -tallene, har vi kun fire uafhængige tal, som vi kan organisere i en tabel:

Sygt sundt eksponeret DEHE Ikke eksponeret DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {Diseased }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {Ikke eksponeret}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

For at undgå mulig forvirring understreger vi, at alle disse tal henviser til hele befolkningen og ikke til en prøve af det.

RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

som kan omskrives som RR = DENNDNNE = DE / DNNE / NN. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}

ELLER = DE / HEDN / HN, {\ displaystyle ELLER = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} som kan omskrives som ELLER = DEHNDNHE = DE / DNHE / HN. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}

Ofte kan vi overvinde dette problem ved at anvende tilfældig prøveudtagning af befolkningen: nemlig hvis hverken sygdommen eller udsættelsen for skaden er for sjældne i vores befolkning, så kan vi vælge (sige ) hundrede mennesker tilfældigt, og find ud af disse fire tal i denne prøve; forudsat at prøven er repræsentativ nok for befolkningen, så vil RR beregnet til denne prøve være et godt skøn for RR for hele befolkningen.

Nogle sygdomme kan dog være så sjældne, at der efter al sandsynlighed , selv en stor tilfældig prøve indeholder måske ikke engang en enkelt syg person (eller den kan indeholde nogle, men for få til at være statistisk signifikante). Dette ville gøre det umuligt at beregne RR. Men vi kan alligevel være i stand til at estimere OR, forudsat at eksponeringen for barndomsskaden i modsætning til sygdommen ikke er for sjælden. Fordi sygdommen er sjælden, er dette selvfølgelig også vores estimat for RR.

Ser man på det endelige udtryk for OR: brøken i tælleren, DE / DN, {\ displaystyle D_ { E} / D_ {N},} kan vi estimere ved at samle alle de kendte tilfælde af sygdommen (formodentlig skal der være nogle, ellers ville vi sandsynligvis ikke foretage undersøgelsen i første omgang) og se hvor mange af de syge mennesker havde eksponering, og hvor mange ikke. Og brøken i nævneren, HE / HN, {\ displaystyle H_ {E} / H_ {N},} er oddsene for, at et sundt individ i befolkningen blev udsat for bemærk nu, at sidstnævnte odds virkelig kan estimeres ved stikprøveudtagning af befolkningen – forudsat, som vi sagde, at forekomsten af eksponeringen for barndomsskaden ikke er for lille, så en tilfældig prøve af en håndterbar størrelse vil sandsynligvis indeholde et rimeligt antal personer, der har haft eksponeringen. Så her er sygdommen meget sjælden, men faktoren troede at bidrage til det er ikke helt så sjældent; sådanne situationer er ret almindelige i praksis.

Således kan vi estimere OR, og derefter påberåber vi den sjældne sygdomsantagelse igen, siger vi, at dette også er en god tilnærmelse af RR. I øvrigt er scenariet beskrevet ovenfor et paradigmatisk eksempel på en case-control-undersøgelse.

Definition i form af gruppevise oddsRediger

Oddsforholdet er forholdet mellem oddsene for en begivenhed, der forekommer i en gruppe til oddsene for, at den forekommer i en anden gruppe. Udtrykket bruges også til at henvise til prøvebaserede skøn over dette forhold. Disse grupper kan være mænd og kvinder, en eksperimentel gruppe og en kontrolgruppe eller enhver anden dikotom klassifikation.Hvis sandsynligheden for begivenheden i hver af grupperne er p1 (første gruppe) og p2 (anden gruppe), så er oddsforholdet:

p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {p_ {1} / (1-p_ {1}) \ over p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ over p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}

hvor qx = 1 – px. Et oddsforhold på 1 indikerer, at den tilstand eller begivenhed, der undersøges, sandsynligvis vil forekomme i begge grupper. Et oddsforhold større end 1 indikerer, at betingelsen eller begivenheden er mere tilbøjelige til at forekomme i den første gruppe. Og et oddsforhold mindre end 1 indikerer, at betingelsen eller begivenheden er mindre tilbøjelige til at forekomme i den første gruppe. Oddsforholdet skal være ikke-negativt, hvis det er defineret. Det er udefineret, hvis p2q1 er lig med nul, dvs. hvis p2 er lig med nul eller q1 er lig med nul.

Definition i form af fælles og betingede sandsynligheder Rediger

Oddsforholdet kan også defineres i termer af den fælles sandsynlighedsfordeling af to binære tilfældige variabler. Den fælles fordeling af binære tilfældige variabler X og Y kan skrives

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

hvor p11, p10, p01 og p00 er ikke-negative “cellesandsynligheder”, der summer til en. Oddsen for Y inden for de to underpopulationer defineret af X = 1 og X = 0 er defineret i form af de betingede sandsynligheder givet X, dvs. P (Y | X):

Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}

Således er oddsforholdet

p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01) } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

Det enkle udtryk til højre over er let at huske som th produkt af sandsynligheden for de “concordante celler” (X = Y) divideret med produktet af sandsynlighederne for de “uoverensstemmende celler” (X ≠ Y). Bemærk dog, at i nogle applikationer er mærkning af kategorier som nul og en vilkårlig, så der er ikke noget særligt ved konkordante versus uoverensstemmende værdier i disse applikationer.

SymmetryEdit

Hvis vi havde beregnet oddsforholdet baseret på de betingede sandsynligheder givet Y,

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

vi ville have opnået det samme resultat

p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}

Andre mål for effektstørrelse for binære data, såsom den relative risiko, har ikke denne symmetriegenskab.

Forhold til statistisk uafhængighed Rediger

Hvis X og Y er uafhængige, kan deres fælles sandsynligheder udtrykkes i form af deres marginale sandsynligheder px = P (X = 1) og py = P (Y = 1) som følger

Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}

I dette tilfælde , er oddsforholdet lig med en, og omvendt kan oddsforholdet kun være ens, hvis den fælles proba bilities kan indregnes på denne måde. Således er oddsforholdet lig med en, hvis og kun hvis X og Y er uafhængige.

Gendannelse af cellesandsynlighederne fra oddsforholdet og marginale sandsynlighederEdit

Oddsforholdet er en funktion af cellen sandsynligheder, og omvendt kan cellesandsynlighederne gendannes givet viden om oddsforholdet og de marginale sandsynligheder P (X = 1) = p11 + p10 og P (Y = 1) = p11 + p01.Hvis oddsforholdet R adskiller sig fra 1, er

p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}

hvor p1 • = p11 + p10, p • 1 = p11 + p01, og

S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}

I tilfælde af at R = 1 har vi uafhængighed, så p11 = p1 • p • 1.

Når vi har p11, er de andre tre celler sandsynligheder kan let gendannes fra de marginale sandsynligheder.

Write a Comment

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *