Sannsynlighetstetthetsfunksjon

Hvis sannsynlighetstetthetsfunksjonen til en tilfeldig variabel (eller vektor) X er gitt som fX (x), er det mulig (men ofte ikke nødvendig; se nedenfor) å beregne sannsynlighets tetthetsfunksjon for noen variabler Y = g (X). Dette kalles også en «endring av variabel» og brukes i praksis for å generere en tilfeldig variabel av vilkårlig form fg (X) = fY ved hjelp av en kjent (for eksempel ensartet) tilfeldig tallgenerator.

Det er fristende å tenke at for å finne den forventede verdien E (g (X)), må man først finne sannsynlighetstettheten fg (X) til den nye tilfeldige variabelen Y = g (X). I stedet for å beregne

E ⁡ (g (X)) = ∫ – ∞ ∞ yfg (X) (y) dy, {\ displaystyle \ operatorname {E} {\ big (} g (X) {\ big)} = \ int _ {- \ infty} ^ {\ infty} yf_ {g (X)} (y) \, dy,}

man kan finne i stedet

E ⁡ (g (X)) = ∫ – ∞ ∞ g (x) f X (x) dx. {\ displaystyle \ operatorname {E} {\ big (} g (X) {\ big)} = \ int _ {- \ infty} ^ {\ infty} g (x) f_ {X} (x) \, dx.}

Verdiene til de to integralene er de samme i alle tilfeller der både X og g (X) faktisk har sannsynlighetstetthetsfunksjoner. Det er ikke nødvendig at g er en en-til-en-funksjon. I noen tilfeller beregnes sistnevnte integral mye lettere enn den tidligere. Se lov om un bevisst statistiker.

Scalar to scalarEdit

La g: R → R {\ displaystyle g: {\ mathbb {R}} \ rightarrow {\ mathbb {R}}} være en monoton funksjon, så er den resulterende tetthetsfunksjonen

f Y (y) = f X (g – 1 (y)) | d d y (g – 1 (y)) | . {\ displaystyle f_ {Y} (y) = f_ {X} {\ big (} g ^ {- 1} (y) {\ big)} \ left | {\ frac {d} {dy}} {\ big (} g ^ {- 1} (y) {\ big)} \ right |.}

Her angir g − 1 den omvendte funksjonen.

Dette følger av det faktum at sannsynligheten i et differensialområde må være uforanderlig under endring av variabler. Det vil si

| f Y (y) d y | = | f X (x) d x | , {\ displaystyle \ left | f_ {Y} (y) \, dy \ right | = \ left | f_ {X} (x) \, dx \ right |,}

eller

f Y ( y) = | d x d y | f X (x) = | d d y (x) | f X (x) = | d d y (g – 1 (y)) | f X (g – 1 (y)) = | (g – 1) ′ (y) | ⋅ f X (g – 1 (y)). {\ displaystyle f_ {Y} (y) = \ left | {\ frac {dx} {dy}} \ right | f_ {X} (x) = \ left | {\ frac {d} {dy}} (x ) \ høyre | f_ {X} (x) = \ venstre | {\ frac {d} {dy}} {\ big (} g ^ {- 1} (y) {\ big)} \ høyre | f_ {X } {\ big (} g ^ {- 1} (y) {\ big)} = {{\ big |} {\ big (} g ^ {- 1} {\ big)} «(y) {\ big |}} \ cdot f_ {X} {\ big (} g ^ {- 1} (y) {\ big)}.}

For funksjoner som ikke er monotone, er sannsynlighetstetthetsfunksjonen for y

∑ k = 1 n (y) | ddygk – 1 (y) | ⋅ f X (gk – 1 (y)), {\ displaystyle \ sum _ {k = 1} ^ {n (y)} \ left | {\ frac {d} {dy}} g_ {k} ^ {- 1} (y) \ right | \ cdot f_ {X} {\ big (} g_ {k} ^ {- 1} (y) {\ stor)},}

Vector to vectorEdit

Formlene ovenfor kan generaliseres til variabler (som vi igjen vil kalle y) avhengig av mer enn en annen variabel. f (x1, …, xn) skal betegne sannsynlighetstetthetsfunksjonen til variablene som y avhenger av, og avhengigheten skal være y = g (x1,…, xn). Deretter er den resulterende tetthetsfunksjonen

∫ y = g (x 1 ,…, Xn) f (x 1,…, xn) ∑ j = 1 n ∂ g ∂ xj (x 1,…, xn) 2 d V, {\ displaystyle \ int \ lim dets _ {y = g (x_ {1}, \ ldots, x_ {n})} {\ frac {f (x_ {1}, \ ldots, x_ {n})} {\ sqrt {\ sum _ {j = 1} ^ {n} {\ frac {\ partial g} {\ partial x_ {j}}} (x_ {1}, \ ldots, x_ {n}) ^ {2}}}} \, dV,}

der integralet er over hele (n – 1) -dimensjonale løsningen i den abonnerte ligningen og den symbolske dV må erstattes av en parametrisering av denne løsningen for en bestemt beregning; variablene x1, …, xn er da selvfølgelig funksjoner for denne parametriseringen.

Dette kommer av følgende, kanskje mer intuitive representasjon: Anta at x er en n-dimensjonal tilfeldig variabel med leddetetthet f. Hvis y = H (x), hvor H er en funksjonell, differensierbar funksjon, har y tetthet g:

g (y) = f (H – 1 (y)) | det | {\ displaystyle g (\ mathbf {y}) = f {\ Big (} H ^ {- 1} (\ mathbf {y}) {\ Big)} \ venstre \ vert \ det \ venstre \ høyre \ vert}

med differensialet betraktet som den jakobiske av det inverse av H (.), evaluert ved y.

g (y 1, y 2) = f X 1, X 2 (H 1 – 1 (y 1, y 2), H 2 – 1 (y 1, y 2)) | ∂ H 1 – 1 ∂ y 1 ∂ H 2 – 1 ∂ y 2 – ∂ H 1 – 1 ∂ y 2 ∂ H 2 – 1 ∂ y 1 | . {\ displaystyle g (y_ {1}, y_ {2}) = f_ {X_ {1}, X_ {2}} {\ big (} H_ {1} ^ {- 1} (y_ {1}, y_ { 2}), H_ {2} ^ {- 1} (y_ {1}, y_ {2}) {\ big)} \ left \ vert {\ frac {\ partial H_ {1} ^ {- 1}} { \ delvis y_ {1}}} {\ frac {\ delvis H_ {2} ^ {- 1}} {\ delvis y_ {2}}} – {\ frac {\ delvis H_ {1} ^ {- 1}} {\ partial y_ {2}}} {\ frac {\ partial H_ {2} ^ {- 1}} {\ partial y_ {1}}} \ right \ vert.}

Vector to scalarEdit

f Y (y) = ∫ R nf X (x) δ (y – V (x)) dx. {\ displaystyle f_ {Y} (y) = \ int _ {{\ mathbb {R}} ^ {n}} f_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf { x}) {\ big)} \, d \ mathbf {x}.}

Dette resultatet fører til den ubevisste statistikerens lov:

EY ⁡ = ∫ R yf Y (y) dy = ∫ R y ∫ R nf X (x) δ (y – V (x)) dxdy = ∫ R n ∫ R yf X (x) δ (y – V (x)) dydx = ∫ R n V (x) f X ( x) dx = EX ⁡.{\ displaystyle \ operatorname {E} _ {Y} = \ int _ {\ mathbb {R}} yf_ {Y} (y) dy = \ int _ {\ mathbb {R}} y \ int _ {{\ mathbb {R}} ^ {n}} f_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf {x}) {\ big)} \, d \ mathbf {x} dy = \ int _ {{\ mathbb {R}} ^ {n}} \ int _ {\ mathbb {R}} yf_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf {x }) {\ big)} \, dyd \ mathbf {x} = \ int _ {{\ mathbb {R}} ^ {n}} V (\ mathbf {x}) f_ {X} (\ mathbf {x} ) d \ mathbf {x} = \ operatorname {E} _ {X}.}

Bevis:

H (Z, X) = = {\ displaystyle H (Z, X) = {\ begin { bmatrix} Z + V (X) \\ X \ end {bmatrix}} = {\ begin {bmatrix} Y \\ {\ tilde {X}} \ end {bmatrix}}}.

Det er tydelig at H {\ displaystyle H} er en bijektiv kartlegging, og den jakobiske av H – 1 {\ displaystyle H ^ {- 1}} er gitt av:

d H – 1 (y, x ~) dydx ~ = {\ displaystyle {\ frac {dH ^ {- 1} (y, {\ tilde {\ mathbf {x}}})} {dy \, d {\ tilde {\ mathbf {x}} }}} = {\ begin {bmatrix} 1 & – {\ frac {dV ({\ tilde {\ mathbf {x}}})} {d {\ tilde {\ mathbf {x}}}}} \\\ mathbf {0} _ {n \ times 1} & \ mathbf {I} _ {n \ times n} \ end {bmatrix }}},

som er en øvre trekantmatrise med en på hoveddiagonalen, og dens determinant er derfor 1. Ved å bruke endringen av variabelteorem fra forrige avsnitt får vi at x) = f X (x) δ (y – V (x)) {\ displaystyle f_ {Y, X} (y, x) = f_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf {x}) {\ big)}},

som hvis marginalisert over x {\ displaystyle x} fører til ønsket sannsynlighetstetthetsfunksjon.

Write a Comment

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *