승산 비

희귀 질환 가정의 맥락에서 동기를 부여하는 예 편집

예를 들어 수천 명의 성인 중 한 명만 괴롭히는 희귀 질환이 있다고 상상해보십시오. 국가. 어떤 것에 노출되면 (예를 들어, 어린 시절에 특정한 종류의 부상을 입었다) 성인기에 그 질병이 발병 할 가능성이 더 높다고 생각한다고 상상해보십시오. 계산할 가장 유익한 것은 위험 비율, RR입니다. 이상적인 경우를 위해, 인구의 모든 성인에 대해 우리는 그들이 (a) 어린 시절 부상에 노출되었는지, (b) 성인으로 질병이 발병했는지 여부를 알아야합니다. 여기에서 다음 정보를 추출 할 수 있습니다. 아동 부상에 노출 된 총 사람 수, NE, {\ displaystyle N_ {E},} 중 DE {\ displaystyle D_ {E}}가 질병에 걸리고 HE {\ displaystyle H_ {E}}는 건강을 유지했습니다. 노출되지 않은 사람의 총 수, N N, {\ displaystyle N_ {N},} 그 중 D N {\ displaystyle D_ {N}}이 질병에 걸리고 H N {\ displaystyle H_ {N}}이 건강을 유지했습니다. NE = DE + HE {\ displaystyle N_ {E} = D_ {E} + H_ {E}} 및 NN {\ displaystyle N_ {N}} 번호의 경우와 마찬가지로, 우리는 구성 할 수있는 4 개의 독립 번호 만 있습니다. 표 :

질병에 걸린 정상 노출 DEHE 노출되지 않음 DNHN {\ displaystyle {\ begin {array} {| r | cc |} \ hline & {\ text {질병 }} & {\ text {정상}} \\\ hline {\ text {노출됨}} & {D_ {E}} & {H_ {E}} \\ {\ text {노출되지 않음}} & {D_ {N}} & {H_ {N}} \\\ hline \ end {array}}}

가능한 혼동을 피하기 위해 이러한 모든 숫자는 일부 샘플이 아닌 전체 모집단을 나타냄을 강조합니다. 그것의.

RR = DE / NEDN / NN, {\ displaystyle RR = {\ frac {D_ {E} / N_ {E}} {D_ {N} / N_ {N}}} \ ,,}

RR = DENNDNNE = DE / DNNE / NN으로 다시 작성할 수 있습니다. {\ displaystyle RR = {\ frac {D_ {E} N_ {N}} {D_ {N} N_ {E}}} = {\ frac {D_ {E} / D_ {N}} {N_ {E} / N_ {N}}}.}

OR = DE / HEDN / HN, {\ displaystyle OR = {\ frac {D_ {E} / H_ {E}} {D_ {N} / H_ {N}} } \ ,,} OR = DEHNDNHE = DE / DNHE / HN으로 다시 작성할 수 있습니다. {\ displaystyle OR = {\ frac {D_ {E} H_ {N}} {D_ {N} H_ {E}}} = {\ frac {D_ {E} / D_ {N}} {H_ {E} / H_ {N}}}.}

종종 무작위 표본 추출을 사용하여이 문제를 극복 할 수 있습니다. 즉, 인구에서 질병이나 부상에 대한 노출이 너무 드물지 않은 경우 선택할 수 있습니다 (예 : ) 100 명을 무작위로, 그 샘플에서이 4 개의 숫자를 찾으십시오. 표본이 모집단을 충분히 대표한다고 가정하면이 표본에 대해 계산 된 RR이 전체 모집단의 RR에 대한 좋은 추정치가 될 것입니다.

그러나 일부 질병은 매우 드물기 때문에 모든 가능성이 있습니다. , 큰 무작위 표본조차도 병에 걸린 개인을 한 명도 포함하지 않을 수 있습니다 (또는 일부를 포함 할 수 있지만 통계적으로 유의하기에는 너무 적습니다). 이것은 RR을 계산하는 것을 불가능하게 만듭니다. 그러나 그럼에도 불구하고 우리는 수술실을 추정 할 수 있습니다. 단, 질병과는 달리 아동기 부상에 대한 노출이 너무 드물지 않은 경우가 있습니다. 물론,이 질병은 드물기 때문에 이것은 RR에 대한 우리의 추정치이기도합니다.

OR의 최종 표현을 보면 분자의 분수, DE / DN, {\ displaystyle D_ { E} / D_ {N},} 질병의 알려진 모든 사례를 수집하여 추정 할 수 있습니다 (아마도 일부가 있거나 그렇지 않으면 처음에 연구를 수행하지 않을 가능성이 있음). 질병에 걸린 사람들이 노출되었고 얼마나 많은 사람들이 노출되지 않았는가. 그리고 분모 인 HE / HN, {\ displaystyle H_ {E} / H_ {N},}는 인구 중 건강한 개인이 노출 될 확률입니다. 이제이 후자의 확률은 인구의 무작위 표본 추출에 의해 실제로 추정 될 수 있습니다. 단, 우리가 말했듯이 소아 부상에 대한 노출의 유병률이 너무 적지 않기 때문에 무작위 표본이 관리 가능한 크기에는 노출 된 사람이 상당히 많을 가능성이 있습니다. 따라서 여기서 질병은 매우 드뭅니다. 그것에 기여하는 것은 그리 드물지 않습니다. 이러한 상황은 실제로 매우 흔합니다.

그러므로 OR을 추정 할 수 있으며 다시 희귀 질환 가정을 호출하면 이것이 RR의 좋은 근사치라고 말합니다. 덧붙여서, 위에 설명 된 시나리오는 사례 통제 연구의 패러다임 예제입니다.

그룹 별 승산에 대한 정의 편집

승산 비는 승산의 비율입니다. 한 그룹에서 발생하는 이벤트와 다른 그룹에서 발생하는 확률. 이 용어는 또한이 비율의 표본 기반 추정치를 나타내는 데 사용됩니다. 이러한 그룹은 남성과 여성, 실험 그룹과 대조군 또는 기타 이분법 적 분류 일 수 있습니다.각 그룹의 사건 확률이 p1 (첫 번째 그룹) 및 p2 (두 번째 그룹) 인 경우 승산 비는 다음과 같습니다.

p 1 / (1 − p 1) p 2 / (1 − p 2) = p 1 / q 1 p 2 / q 2 = p 1 q 2 p 2 q 1, {\ displaystyle {p_ {1} / (1-p_ {1}) \ over p_ {2} / (1- p_ {2})} = {p_ {1} / q_ {1} \ over p_ {2} / q_ {2}} = {\ frac {\; p_ {1} q_ {2} \;} {\; p_ {2} q_ {1} \;}},}

여기서 qx = 1 − px. 승산 비가 1이면 연구중인 상태 또는 사건이 두 그룹에서 똑같이 발생할 가능성이 있음을 나타냅니다. 승산 비가 1보다 크면 조건이나 사건이 첫 번째 그룹에서 발생할 가능성이 더 높다는 것을 나타냅니다. 승산 비가 1보다 작 으면 조건이나 사건이 첫 번째 그룹에서 발생할 가능성이 적음을 나타냅니다. 승산 비는 정의 된 경우 음수가 아니어야합니다. p2q1이 0이면 정의되지 않습니다. 즉, p2가 0이거나 q1이 0이면 정의됩니다.

관절 및 조건부 확률로 정의 편집

승산 비는 용어로도 정의 할 수 있습니다. 두 이진 확률 변수의 공동 확률 분포의. 이진 확률 변수 X와 Y의 결합 분포는 쓸 수 있습니다

Y = 1 Y = 0 X = 1 p 11 p 10 X = 0 p 01 p 00 {\ displaystyle {\ begin {array} {c | cc } & Y = 1 & Y = 0 \\\ hline X = 1 & p_ {11} & p_ {10} \\ X = 0 & p_ {01} & p_ {00} \ end {array}}}

여기서 p11, p10, p01 및 p00은 합계가 1 인 음이 아닌 “셀 확률”입니다. X = 1 및 X = 0으로 정의 된 두 부분 집단 내의 Y에 대한 확률은 X가 주어진 조건부 확률로 정의됩니다. 즉, P (Y | X) :

Y = 1 Y = 0 X = 1 p 11 p 11 + p 10 p 10 p 11 + p 10 X = 0 p 01 p 01 + p 00 p 00 p 01 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & {\ frac {p_ { 11}} {p_ {11} + p_ {10}}} & {\ frac {p_ {10}} {p_ {11} + p_ {10}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {01} + p_ {00}}} & {\ frac {p_ {00}} {p_ {01} + p_ {00}}} \ end {array}}}

따라서 승산 비는

p 11 / (p 11 + p 10) p 10 / (p 11 + p 10) / p 01 / (p 01 + p 00) p 00 / (p 01 + p 00) = p 11 p 00 p 10 p 01 {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {10})} {p_ {10} / (p_ {11} + p_ {10})}} {\ bigg /} {\ dfrac {p_ {01} / (p_ {01 } + p_ {00})} {p_ {00} / (p_ {01} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01 }}}}

위 오른쪽의 간단한 표현은 th로 기억하기 쉽습니다. e “일치 세포”(X = Y)의 확률 곱을 “불일치 세포”(X ≠ Y)의 확률 곱으로 나눈 값입니다. 그러나 일부 응용 프로그램에서는 범주를 0과 1로 표시하는 것이 임의적이므로 이러한 응용 프로그램에서 일치 값과 불일치 값에 대해 특별한 것이 없습니다.

SymmetryEdit

계산 한 경우 Y가 주어진 조건부 확률에 기반한 승산 비,

Y = 1 Y = 0 X = 1 p 11 p 11 + p 01 p 10 p 10 + p 00 X = 0 p 01 p 11 + p 01 p 00 p 10 + p 00 {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \ \\ hline X = 1 & {\ frac {p_ {11}} {p_ {11} + p_ {01}}} & {\ frac {p_ {10}} {p_ {10} + p_ {00}}} \\ X = 0 & {\ frac {p_ {01}} {p_ {11} + p_ {01}}} & {\ frac {p_ {00}} {p_ {10} + p_ {00}}} \ end {array}}}

같은 결과를 얻었을 것입니다

p 11 / (p 11 + p 01) p 01 / (p 11 + p 01) / p 10 / (p 10 + p 00) p 00 / (p 10 + p 00) = p 11 p 00 p 10 p 01. {\ displaystyle {{\ dfrac {p_ {11} / (p_ {11} + p_ {01})} {p_ {01} / (p_ {11} + p_ {01})}} {\ bigg /} { \ dfrac {p_ {10} / (p_ {10} + p_ {00})} {p_ {00} / (p_ {10} + p_ {00})}}} = {\ dfrac {p_ {11} p_ {00}} {p_ {10} p_ {01}}}.}

상대 위험과 같은 이진 데이터에 대한 효과 크기의 다른 측정 값에는이 대칭 속성이 없습니다.

통계와의 관계 independentEdit

X와 Y가 독립적 인 경우 결합 확률은 다음과 같이 한계 확률 px = P (X = 1) 및 py = P (Y = 1)로 표현할 수 있습니다.

Y = 1 Y = 0 X = 1 pxpypx (1 − py) X = 0 (1 − px) py (1 − px) (1 − py) {\ displaystyle {\ begin {array} {c | cc} & Y = 1 & Y = 0 \\\ hline X = 1 & p_ { x} p_ {y} & p_ {x} (1-p_ {y}) \\ X = 0 & (1- p_ {x}) p_ {y} & (1-p_ {x}) (1-p_ {y}) \ end {array}}}

이 경우 , 승산 비가 1과 같고 반대로 승산 비는 합동 프로 바가 이러한 방식으로 능력을 고려할 수 있습니다. 따라서 승산 비는 X와 Y가 독립적 인 경우에만 1과 같습니다.

승산 비와 한계 확률에서 셀 확률 복구 편집

승산 비는 셀의 함수입니다. 확률, 반대로 승산 비와 한계 확률 P (X = 1) = p11 + p10 및 P (Y = 1) = p11 + p01에 대한 지식이 주어지면 셀 확률을 복구 할 수 있습니다.승산 비 R이 1과 다르면

p 11 = 1 + (p 1 ⋅ + p ⋅ 1) (R − 1) − S 2 (R − 1) {\ displaystyle p_ {11} = { \ frac {1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1) -S} {2 (R-1)}}}

여기서 p1 • = p11 + p10, p • 1 = p11 + p01,

S = (1 + (p 1 ⋅ + p ⋅ 1) (R − 1)) 2 + 4 R (1 − R) p 1 ⋅ p ⋅ 1. {\ displaystyle S = {\ sqrt {(1+ (p_ {1 \ cdot} + p _ {\ cdot 1}) (R-1)) ^ {2} + 4R (1-R) p_ {1 \ cdot} p _ {\ cdot 1}}}.}

R = 1 인 경우 독립성이 있으므로 p11 = p1 • p • 1.

p11이 있으면 나머지 세 개의 셀 확률은 한계 확률에서 쉽게 복구 할 수 있습니다.

Write a Comment

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다