Motiváló példa a ritka betegség feltételezésével összefüggésbenEdit
Képzelje el, hogy van egy ritka betegség, mondjuk csak egy a sok ezer felnőttből egy ország. Képzelje el, hogy gyanítjuk, hogy valaminek kitéve (mondjuk, gyermekkorában különös sérülést szenvedett) nagyobb valószínűséggel alakul ki a betegség felnőttkorban. A leginformatívabb dolog a kockázati arány, az RR kiszámítása. Ehhez ideális esetben a populáció összes felnőttének meg kell tudnunk, hogy (a) gyermekkorukban ki voltak-e téve a sérülésnek és (b) felnőttként alakultak-e ki a betegségben. Ebből a következő információkat vonnánk ki: a gyermekkori sérülésnek kitett emberek teljes száma, NE, {\ displaystyle N_ {E},} amelyek közül DE {\ displaystyle D_ {E}} fejlesztette ki a betegséget és HE {\ a display_stílus H_ {E}} egészséges maradt; és a nem kitett emberek teljes száma, N N, {\ displaystyle N_ {N},} amelyek közül D N {\ displaystyle D_ {N}} fejlesztette ki a betegséget, H N {\ displaystyle H_ {N}} pedig egészséges maradt. Mivel NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} és hasonlóan az NN {\ displaystyle N_ {N}} számokhoz, csak négy független számunk van, amelyeket rendszerezhetünk táblázatban:
Beteg, Egészségesen kitett DEHE Nincs kitéve DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {Beteg }} & {\ text {Healthy}} \\\ hline {\ text {Exposed}} & {D_ {E}} & {H_ {E}} \\ {\ text {Nincs kitéve}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}
Az esetleges összetévesztés elkerülése érdekében hangsúlyozzuk, hogy ezek a számok a teljes populációra vonatkoznak, nem pedig valamilyen mintára belőle.
RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}
amely átírható RR = DENNDNNE = DE / DNNE / NN néven. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}
OR = DE / HEDN / HN, {\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} amely OR = DEHNDNHE = DE / DNHE / HN néven átírható. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}
Ezt a problémát gyakran a populáció véletlenszerű mintavételével lehet legyőzni: nevezetesen, ha sem a betegség, sem a sérülésnek való kitettség nem túl ritka a populációnkban, akkor választhatunk ) száz ember véletlenszerűen, és megtudja ezt a négy számot abban a mintában; feltételezve, hogy a minta elég reprezentatív a populációhoz, akkor az ehhez a mintához kiszámított RR jó becslés lesz az egész populáció RR-jére.
Egyes betegségek azonban olyan ritkák lehetnek, hogy minden valószínűség szerint , még egy nagy véletlenszerű minta sem tartalmazhat egyetlen beteg egyedet (vagy tartalmazhat néhányat, de túl keveset ahhoz, hogy statisztikailag szignifikáns legyen). Ez lehetetlenné tenné az RR kiszámítását. De ennek ellenére képesek lehetünk megbecsülni a legkülső régiókat, feltéve, hogy a betegséggel ellentétben a gyermekkori sérülés nem túl ritka. Természetesen, mivel a betegség ritka, ez a becslésünk az RR-re is.
Az OR végső kifejezését tekintve: a számlálóban szereplő frakció, DE / DN, {\ displaystyle D_ { E} / D_ {N},} megbecsülhetjük a betegség összes ismert esetének összegyűjtésével (feltehetően ezeknek kell lenniük, különben valószínűleg nem először végezzük a vizsgálatot), és megnézzük, hogy hány a beteg embereknek volt kitettségük, és hányuknak nem. És a nevező (HE / HN, {\ displaystyle H_ {E} / H_ {N}}) hányadosa annak az esélye, hogy a populációban egészséges egyén volt kitéve Most vegye figyelembe, hogy ez utóbbi esélyeket valóban meg lehet becsülni a populáció véletlenszerű mintavételével – feltéve, mint mondtuk, hogy a gyermekkori sérülésnek való kitettség előfordulása nem túl kicsi, így egy A kezelhető méret valószínűleg elég sok olyan személyt tartalmazna, akiknek volt kitéve. Tehát itt a betegség nagyon ritka, de a tényező hozzájárulni nem egészen ritka; az ilyen helyzetek meglehetősen gyakoriak a gyakorlatban.
Így megbecsülhetjük az OR-t, majd ismét a ritka betegség feltételezésére hivatkozva azt mondjuk, hogy ez is jó közelítése az RR-nek. A fent leírt szcenárió egyébként paradigmatikus példa egy esettanulmány-vizsgálatra.
Definíció csoportonkénti oddsEdit
Az esélyhányados az egy esély esélyének az aránya az egyik csoportban előforduló esemény annak valószínűségével, hogy egy másik csoportban előfordul. A kifejezést ezen arány mintalapú becsléseire is használják. Ezek a csoportok lehetnek férfiak és nők, kísérleti csoport és kontrollcsoport, vagy bármely más dichotóm osztályozás.Ha az esemény valószínűsége az egyes csoportokban p1 (első csoport) és p2 (második csoport), akkor az esélyek aránya:
p 1 / (1 – p 1) p 2 / (1 – p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {p_ {1} / (1-p_ {1}) \ felett p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}
ahol qx = 1 – px. Az 1-es esélyarány azt jelzi, hogy a vizsgált állapot vagy esemény mindkét csoportban egyformán valószínű. 1-nél nagyobb esélyhányados azt jelzi, hogy a feltétel vagy esemény nagyobb valószínűséggel fordul elő az első csoportban. Az 1-nél kisebb esélyhányados pedig azt jelzi, hogy a feltétel vagy esemény az első csoportban kevésbé valószínű. Az esély arányának nem negatívnak kell lennie, ha meg van határozva. Nincs meghatározva, ha p2q1 egyenlő nulla, azaz ha p2 egyenlő nulla vagy q1 egyenlő nulla értékkel.
Definíció együttes és feltételes valószínűségekkelEdit
Az esélyhányados kifejezésekkel is meghatározható két bináris véletlen változó együttes valószínűségi eloszlásának. Az X és Y bináris véletlen változók együttes eloszlása írható
Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {tömb} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {tömb}}}
ahol a p11, p10, p01 és p00 nem negatív “cella valószínűségek”, amelyek összeadódnak. Az X = 1 és X = 0 által definiált két alpopuláció Y-szorzatait az X-nek adott feltételes valószínűségek, azaz P (Y | X) alapján határozzuk meg:
Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {tömb}}}
Így az esélyhányados
p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}
A fenti jobb oldali egyszerű kifejezés könnyen megjegyezhető, mint th A “konkordáns sejtek” (X = Y) valószínűségének szorzata elosztva a “diszkonzoráns sejtek” valószínűségének szorzatával (X ≠ Y). Azonban vegye figyelembe, hogy egyes alkalmazásokban a kategóriák nullának és egynek jelölése tetszőleges, ezért nincs semmi különös az konkordáns és az ellentétes értékekben ezekben az alkalmazásokban. az odds arány az adott Y feltételezett valószínűségek alapján,
Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {tömb} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {tömb}}}
ugyanazt az eredményt kaptuk volna
p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}
A bináris adatok egyéb effektusmérőinek, például a relatív kockázatnak nincs ilyen szimmetriatulajdonsága.
Kapcsolat a statisztikai adatokkal independentEdit
Ha X és Y függetlenek, együttes valószínűségeik kifejezhetők marginális valószínűségeik szerint px = P (X = 1) és py = P (Y = 1), az alábbiak szerint
Y = 1 Y = 0 X = 1 pxpypx (1 – py) X = 0 (1 – px) py (1 – px) (1 – py) {\ displaystyle {\ begin {tömb} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {tömb}}}
Ebben az esetben , az esélyhányados megegyezik, és fordítva az esélyhányados csak akkor lehet egyenlő, ha a közös proba a bilitást így lehet figyelembe venni. Így az esélyek aránya akkor és akkor egyenlő, ha X és Y függetlenek.
A cella valószínűségének helyreállítása az odds arányból és a marginális valószínűségekbőlEdit
Az esély arány a cella függvénye valószínûségeket, és fordítva, a sejtek valószínûségét vissza lehet adni, ha ismerjük az esélyek arányát és a P (X = 1) = p11 + p10 és P (Y = 1) = p11 + p01 marginális valószínűségeket.Ha az R esélyhányados eltér 1-től, akkor
p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R – 1) – S 2 (R – 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}
ahol p1 • = p11 + p10, p • 1 = p11 + p01, és
S = (1 + (p 1 ⋅ + p ⋅ 1) (R – 1)) 2 + 4 R (1 – R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}
Abban az esetben, ha R = 1, függetlenségünk van, tehát p11 = p1 • p • 1.
Miután megvan a p11, a másik három cella a valószínűségek könnyen visszaszerezhetők a marginális valószínűségekből.