Motivující příklad v kontextu předpokladu vzácných onemocnění Upravit
Představte si, že existuje vzácné onemocnění, které postihuje, řekněme, jen jedno z mnoha tisíců dospělých v země. Představte si, že máme podezření, že vystavení něčemu (řekněme mít v dětství určitý druh zranění) zvyšuje pravděpodobnost vzniku této choroby v dospělosti. Nejinformativnější věcí, kterou lze vypočítat, by byl poměr rizika, RR. Abychom to mohli udělat v ideálním případě, potřebovali bychom u všech dospělých v populaci vědět, zda (a) byli vystaveni úrazu jako děti ab) zda se u nich onemocnění vyvinulo jako u dospělých. Z toho bychom extrahovali následující informace: celkový počet lidí vystavených úrazu v dětství, NE, {\ displaystyle N_ {E},} z nichž DE {\ displaystyle D_ {E}} onemocnělo a HE {\ displaystyle H_ {E}} zůstal zdravý; a celkový počet lidí, kteří nebyli vystaveni, N N, {\ displaystyle N_ {N},} z toho se nemoc rozvinula a N N zůstala zdravá. N N {\ displaystyle D_ {N}} Protože NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} a podobně pro čísla NN {\ displaystyle N_ {N}}, máme pouze čtyři nezávislá čísla, která můžeme uspořádat v tabulce:
Nemocný Zdravý Vystavený DEHE Nevystavený DNHN {\ displaystyle {\ begin {pole} {| r | cc |} \ hline & {\ text {Nemocný }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {Nevystaveno}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}
Abychom se vyhnuli nejasnostem, zdůrazňujeme, že všechna tato čísla odkazují na celou populaci, nikoli na nějaký vzorek toho.
RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}
které lze přepsat jako RR = DENNDNNE = DE / DNNE / NN. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}
OR = DE / HEDN / HN, {\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,}, které lze přepsat jako OR = DEHNDNHE = DE / DNHE / HN. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}
Často můžeme tento problém překonat použitím náhodných vzorků populace: jmenovitě, pokud ani nemoc, ani expozice úrazu nejsou v naší populaci příliš vzácné, pak můžeme vybrat (řekněme ) sto lidí náhodně a zjistěte tato čtyři čísla v tomto vzorku; za předpokladu, že vzorek je dostatečně reprezentativní pro populaci, pak RR vypočtená pro tento vzorek bude dobrým odhadem pro RR pro celou populaci.
Některá onemocnění však mohou být tak vzácná, že se vší pravděpodobností , ani velký náhodný vzorek nemusí obsahovat ani jednoho nemocného jedince (nebo může obsahovat některé, ale příliš málo na to, aby byly statisticky významné). To by znemožnilo výpočet RR. Možná však budeme schopni odhadnout OR, za předpokladu, že na rozdíl od nemoci není expozice dětskému zranění příliš vzácná. Jelikož je nemoc vzácná, je to samozřejmě také náš odhad RR.
Podíváme-li se na konečný výraz pro OR: zlomek v čitateli, DE / DN, {\ displaystyle D_ { E} / D_ {N},} můžeme odhadnout shromážděním všech známých případů nemoci (pravděpodobně nějaké musí být, jinak bychom studii pravděpodobně neprovedli) a uvidíme, kolik z nemocní lidé měli expozici a kolik ne. A zlomek ve jmenovateli, HE / HN, {\ displaystyle H_ {E} / H_ {N},} je pravděpodobnost, že byl vystaven zdravý jedinec v populaci k dětskému úrazu. Nyní si všimněte, že tuto druhou šanci lze skutečně odhadnout náhodným výběrem populace – za předpokladu, jak jsme řekli, že prevalence expozice dětskému úrazu není příliš malá, takže náhodný vzorek zvládnutelná velikost by pravděpodobně obsahovala slušný počet jedinců, kteří měli expozici. Takže tady je nemoc velmi vzácná, ale faktor si myslel přispívat k tomu není tak vzácné; takové situace jsou v praxi zcela běžné.
Můžeme tedy odhadnout OR a poté, když znovu použijeme předpoklad vzácných onemocnění, řekneme, že je to také dobrá aproximace RR. Výše popsaný scénář je mimochodem paradigmatickým příkladem studie případové kontroly.
Definice z hlediska skupinového kurzuEdit
Kurzový poměr je poměr pravděpodobnosti událost vyskytující se v jedné skupině s pravděpodobností výskytu v jiné skupině. Termín se také používá k označení odhadů tohoto poměru na základě vzorků. Těmito skupinami mohou být muži a ženy, experimentální skupina a kontrolní skupina nebo jakákoli jiná dichotomická klasifikace.Pokud jsou pravděpodobnosti události v každé ze skupin p1 (první skupina) a p2 (druhá skupina), pak je poměr šancí:
p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {p_ {1} / (1-p_ {1}) \ nad p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ nad p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}
kde qx = 1 – px. Poměr šancí 1 naznačuje, že studovaný stav nebo událost je stejně pravděpodobná u obou skupin. Poměr šancí větší než 1 naznačuje, že stav nebo událost je pravděpodobnější v první skupině. A poměr šancí menší než 1 naznačuje, že stav nebo událost je méně pravděpodobné, že se vyskytnou v první skupině. Poměr šancí musí být nezáporný, pokud je definován. Není definováno, pokud se p2q1 rovná nule, tj. Pokud se p2 rovná nule nebo q1 se rovná nule.
Definice z hlediska společné a podmíněné pravděpodobnosti Upravit
Poměr šancí lze definovat také z hlediska společného rozdělení pravděpodobnosti dvou binárních náhodných proměnných. Lze zapsat společné rozdělení binárních náhodných proměnných X a Y
Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}
kde p11, p10, p01 a p00 jsou nezáporné „pravděpodobnosti buněk“, které jsou součtem jedné. Šance na Y v rámci dvou subpopulací definovaných X = 1 a X = 0 jsou definovány z hlediska podmíněných pravděpodobností daných X, tj. P (Y | X):
Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {pole} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {pole}}}
Poměr šancí je tedy
p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}
Jednoduchý výraz vpravo nahoře je snadno zapamatovatelný jako th Součin pravděpodobností „shodných buněk“ (X = Y) děleno součinem pravděpodobností „nesouhlasných buněk“ (X ≠ Y). Mějte však na paměti, že v některých aplikacích je označení kategorií jako nula a jedna libovolné, takže v těchto aplikacích není nic zvláštního na shodných a nesouhlasných hodnotách.
SymmetryEdit
Pokud bychom vypočítali poměr šancí na základě podmíněných pravděpodobností daných Y,
Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {pole} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {pole}}}
dostali bychom stejný výsledek
p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}
Jiná měřítka velikosti efektu pro binární data, jako je relativní riziko, tuto vlastnost symetrie nemají.
Vztah ke statistice independentEdit
Pokud jsou X a Y nezávislé, lze jejich společné pravděpodobnosti vyjádřit pomocí jejich mezních pravděpodobností px = P (X = 1) a py = P (Y = 1), následovně
Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {pole} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1 p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {pole}}}
V tomto případě , poměr šancí se rovná jedné a naopak poměr šancí se může rovnat pouze jedné, pokud jde o společnou probu tímto způsobem lze zohlednit schopnosti. Poměr šancí se tedy rovná jedné právě tehdy, jsou-li X a Y nezávislé.
Obnovení pravděpodobností buňky z poměru šancí a mezních pravděpodobnostíEdit
Kurzový poměr je funkcí buňky pravděpodobnosti a naopak pravděpodobnosti buněk lze obnovit na základě znalosti poměru šancí a mezních pravděpodobností P (X = 1) = p11 + p10 a P (Y = 1) = p11 + p01.Pokud se poměr šancí R liší od 1, pak
p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}
kde p1 • = p11 + p10, p • 1 = p11 + p01 a
S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}
V případě, že R = 1, máme nezávislost, takže p11 = p1 • p • 1.
Jakmile máme p11, další tři buňky pravděpodobnosti lze snadno získat z mezních pravděpodobností.