Als de kansdichtheidsfunctie van een willekeurige variabele (of vector) X wordt gegeven als fX (x), is het mogelijk (maar vaak niet noodzakelijk; zie hieronder) om de kansdichtheidsfunctie van een variabele Y = g (X). Dit wordt ook wel een “verandering van variabele” genoemd en wordt in de praktijk gebruikt om een willekeurige variabele met een willekeurige vorm fg (X) = fY te genereren met behulp van een bekende (bijvoorbeeld uniforme) generator voor willekeurige getallen.
Het is verleidelijk om te denken dat om de verwachte waarde E (g (X)) te vinden, men eerst de kansdichtheid fg (X) van de nieuwe willekeurige variabele Y = g (X) moet vinden. In plaats van te berekenen
E (g (X)) = ∫ – ∞ ∞ yfg (X) (y) dy, {\ displaystyle \ operatorname {E} {\ big (} g (X) {\ big)} = \ int _ {- \ infty} ^ {\ infty} yf_ {g (X)} (y) \, dy,}
in plaats daarvan kan men vinden
E (g (X)) = ∫ – ∞ ∞ g (x) f X (x) dx. {\ displaystyle \ operatorname {E} {\ big (} g (X) {\ big)} = \ int _ {- \ infty} ^ {\ infty} g (x) f_ {X} (x) \, dx.}
De waarden van de twee integralen zijn hetzelfde in alle gevallen waarin zowel X als g (X) feitelijk kansdichtheidsfuncties hebben. Het is niet nodig dat g een een-op-een-functie. In sommige gevallen wordt de laatste integraal veel gemakkelijker berekend dan de eerste. Zie Wet van de VN bewuste statisticus.
Scalair naar scalair Bewerken
Laat g: R → R {\ displaystyle g: {\ mathbb {R}} \ rightarrow {\ mathbb {R}}} een monotone functie, dan is de resulterende dichtheidsfunctie
f Y (y) = f X (g – 1 (y)) | d d y (g – 1 (y)) |{\ displaystyle F_ {Y} (y) = f_ {X} {\ big (} g ^ {- 1} (y) {\ big)} \ left | {\ frac {d} {dy}} {\ big (} g ^ {- 1} (y) {\ big)} \ right |.}
Hier geeft g − 1 de inverse functie aan.
Dit volgt uit het feit dat de kans die is vervat in een differentieel gebied moet invariant zijn onder verandering van variabelen. Dat wil zeggen,
| f Y (y) d y |f X (x) d x | , {\ Displaystyle \ left | F_ {Y} (y) \, dy \ right | = \ left | F_ {X} (x) \, dx \ right |,}
of
f Y ( y) = | d x d y | f X (x) = | d d y (x) | f X (x) = | d d y (g – 1 (y)) | f X (g – 1 (y)) = | (g – 1) ′ (y) | ⋅ f X (g – 1 (y)). {\ displaystyle F_ {Y} (y) = \ left | {\ frac {dx} {dy}} \ right | F_ {X} (x) = \ left | {\ frac {d} {dy}} (x ) \ right | f_ {X} (x) = \ left | {\ frac {d} {dy}} {\ big (} g ^ {- 1} (y) {\ big)} \ right | f_ {X } {\ big (} g ^ {- 1} (y) {\ big)} = {{\ big |} {\ big (} g ^ {- 1} {\ big)} “(y) {\ big |}} \ cdot f_ {X} {\ big (} g ^ {- 1} (y) {\ big)}.}
Voor functies die niet monotoon zijn, is de kansdichtheidsfunctie voor y
∑ k = 1 n (y) | ddygk – 1 (y) | ⋅ f X (gk – 1 (y)), {\ displaystyle \ sum _ {k = 1} ^ {n (y)} \ left | {\ frac {d} {dy}} g_ {k} ^ {- 1} (y) \ right | \ cdot f_ {X} {\ big (} g_ {k} ^ {- 1} (y) {\ big)},}
Vector naar vectorEdit
De bovenstaande formules kunnen gegeneraliseerd worden naar variabelen (die we weer y zullen noemen) afhankelijk van meer dan één andere variabele. f (x1, …, xn) geeft de kansdichtheidsfunctie aan van de variabelen waarvan y afhangt, en de afhankelijkheid zal y = g (x1, …, xn) zijn. Dan is de resulterende dichtheidsfunctie
∫ y = g (x 1 , …, xn) f (x 1, …, xn) ∑ j = 1 n ∂ g ∂ xj (x 1, …, xn) 2 d V, {\ displaystyle \ int \ lim zijn _ {y = g (x_ {1}, \ ldots, x_ {n})} {\ frac {f (x_ {1}, \ ldots, x_ {n})} {\ sqrt {\ som _ {j = 1} ^ {n} {\ frac {\ partiële g} {\ partiële x_ {j}}} (x_ {1}, \ ldots, x_ {n}) ^ {2}}}} \, dV,}
waarbij de integraal zich over de gehele (n – 1) -dimensionale oplossing van de subscriptvergelijking bevindt en de symbolische dV moet worden vervangen door een parametrisering van deze oplossing voor een bepaalde berekening; de variabelen x1, …, xn zijn dan natuurlijk functies van deze parametrisatie.
Dit vloeit voort uit de volgende, misschien meer intuïtieve weergave: Stel dat x een n-dimensionale willekeurige variabele is met gewrichtsdichtheid f. Als y = H (x), waar H een bijectieve, differentieerbare functie is, dan heeft y dichtheid g:
g (y) = f (H – 1 (y)) | det | {\ displaystyle g (\ mathbf {y}) = f {\ Big (} H ^ {- 1} (\ mathbf {y}) {\ Big)} \ left \ vert \ det \ left \ right \ vert}
met het differentieel beschouwd als de Jacobiaan van de inverse van H (.), geëvalueerd als y.
g (y 1, y 2) = f X 1, X 2 (H 1 – 1 (y 1, y 2), H 2-1 (y 1, y 2)) | ∂ H 1 – 1 ∂ Y 1 2 H 2 – 1 ∂ Y 2 – ∂ H 1 – 1 ∂ Y 2 ∂ H 2 – 1 ∂ Y 1 |{\ displaystyle g (y_ {1}, y_ {2}) = f_ {X_ {1}, X_ {2}} {\ big (} H_ {1} ^ {- 1} (y_ {1}, y_ { 2}), H_ {2} ^ {- 1} (y_ {1}, y_ {2}) {\ big)} \ left \ vert {\ frac {\ gedeeltelijke H_ {1} ^ {- 1}} { \ partiële y_ {1}}} {\ frac {\ partiële H_ {2} ^ {- 1}} {\ partiële y_ {2}}} – {\ frac {\ partiële H_ {1} ^ {- 1}} {\ partiële y_ {2}}} {\ frac {\ partiële H_ {2} ^ {- 1}} {\ partiële y_ {1}}} \ right \ vert.}
Vector naar scalaire bewerking
f Y (Y) = ∫ R nf X (X) δ (Y – V (X)) dx. {\ displaystyle F_ {Y} (y) = \ int _ {{\ mathbb {R}} ^ {n}} f_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf { x}) {\ big)} \, d \ mathbf {x}.}
Dit resultaat leidt tot de wet van de onbewuste statisticus:
EY = ∫ R yf Y (y) dy = ∫ R y ∫ R nf X (x) δ (y – V (x)) dxdy = ∫ R n ∫ R yf X (x) δ (y – V (x)) dydx = ∫ R n V (x) f X ( x) dx = EX .{\ displaystyle \ operatornaam {E} _ {Y} = \ int _ {\ mathbb {R}} yf_ {Y} (y) dy = \ int _ {\ mathbb {R}} y \ int _ {{\ mathbb {R}} ^ {n}} f_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf {x}) {\ big)} \, d \ mathbf {x} dy = \ int _ {{\ mathbb {R}} ^ {n}} \ int _ {\ mathbb {R}} yf_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf {x }) {\ big)} \, dyd \ mathbf {x} = \ int _ {{\ mathbb {R}} ^ {n}} V (\ mathbf {x}) f_ {X} (\ mathbf {x} ) d \ mathbf {x} = \ operatornaam {E} _ {X}.}
Bewijs:
H (Z, X) = = {\ displaystyle H (Z, X) = {\ begin { bmatrix} Z + V (X) \\ X \ end {bmatrix}} = {\ begin {bmatrix} Y \\ {\ tilde {X}} \ end {bmatrix}}}.
Het is duidelijk dat H {\ displaystyle H} een bijectieve afbeelding is, en de Jacobiaan van H – 1 {\ displaystyle H ^ {- 1}} wordt gegeven door:
d H – 1 (y, x ~) dydx ~ = {\ displaystyle {\ frac {dH ^ {- 1} (y, {\ tilde {\ mathbf {x}}})} {dy \, d {\ tilde {\ mathbf {x}} }}} = {\ begin {bmatrix} 1 & – {\ frac {dV ({\ tilde {\ mathbf {x}}})} {d {\ tilde {\ mathbf {x}}}}} \\\ mathbf {0} _ {n \ maal 1} & \ mathbf {I} _ {n \ maal n} \ end {bmatrix }}},
wat een bovenste driehoekige matrix is met enen op de hoofddiagonaal, daarom is de bepalende factor 1. Als we de verandering van de variabele stelling uit de vorige sectie toepassen, krijgen we dat
f Y, X (y, x) = f X (x) δ (y – V (x)) {\ displaystyle F_ {Y, X} (y, x) = f_ {X} (\ mathbf {x}) \ delta {\ big (} yV (\ mathbf {x}) {\ big)}},
die, indien gemarginaliseerd over x {\ displaystyle x}, leidt tot de gewenste kansdichtheidsfunctie.