確率変数(またはベクトル)Xの確率密度関数がfX(x)として与えられる場合、次のように計算することができます(ただし、多くの場合、必須ではありません。以下を参照)。ある変数Y = g(X)の確率密度関数。これは「変数変換」とも呼ばれ、実際には、既知の(たとえば一様な)乱数ジェネレーターを使用して任意の形状の確率変数fg(X)= fYを生成するために使用されます。
Itは、期待値E(g(X))を見つけるために、最初に新しい確率変数Y = g(X)の確率密度fg(X)を見つける必要があると考えたくなります。ただし、計算するのではなく
E(g(X))= ∫−∞∞yfg(X)(y)dy、{\ displaystyle \ operatorname {E} {\ big(} g(X){\ big)} = \ int _ {-\ infty} ^ {\ infty} yf_ {g(X)}(y)\、dy、}
代わりに見つけることができる
E(g(X))= ∫−∞∞g (x)f X(x)dx。{\ displaystyle \ operatorname {E} {\ big(} g(X){\ big)} = \ int _ {-\ infty} ^ {\ infty} g(x) f_ {X}(x)\、dx。}
2つの積分の値は、Xとg(X)の両方が実際に確率密度関数を持つすべての場合で同じです。gがaである必要はありません。 1対1の関数。場合によっては、後者の積分は前者よりもはるかに簡単に計算されます。国連の法則を参照してください。意識的な統計学者。
スカラーからscalarEdit
g:R→R {\ displaystyle g:{\ mathbb {R}} \ rightarrow {\ mathbb {R}}}を単調関数の場合、結果の密度関数は次のようになります。
f Y(y)= f X(g − 1(y))| d d y(g − 1(y))| 。 {\ displaystyle f_ {Y}(y)= f_ {X} {\ big(} g ^ {-1}(y){\ big)} \ left | {\ frac {d} {dy}} {\ big (} g ^ {-1}(y){\ big)} \ right |。}
ここでg-1は逆関数を示します。
これは、に含まれる確率が微分面積は、変数変換の下で不変でなければなりません。つまり、
| f Y(y)d y | = | f X(x)d x | 、{\ displaystyle \ left | f_ {Y}(y)\、dy \ right | = \ left | f_ {X}(x)\、dx \ right |、}
または
f Y( y)= | d x d y | f X(x)= | d d y(x)| f X(x)= | d d y(g − 1(y))| f X(g − 1(y))= | (g − 1) ′(y)| ⋅fX(g − 1(y))。 {\ displaystyle f_ {Y}(y)= \ left | {\ frac {dx} {dy}} \ right | f_ {X}(x)= \ left | {\ frac {d} {dy}}(x )\ right | f_ {X}(x)= \ left | {\ frac {d} {dy}} {\ big(} g ^ {-1}(y){\ big)} \ right | f_ {X } {\ big(} g ^ {-1}(y){\ big)} = {{\ big |} {\ big(} g ^ {-1} {\ big)} “(y){\ big |}} \ cdot f_ {X} {\ big(} g ^ {-1}(y){\ big)}。}
単調でない関数の場合、yの確率密度関数は
∑ k = 1 n(y)| ddygk − 1(y)|⋅fX(gk − 1(y))、{\ displaystyle \ sum _ {k = 1} ^ {n(y)} \ left | {\ frac {d} {dy}} g_ {k} ^ {-1}(y)\ right | \ cdot f_ {X} {\ big(} g_ {k} ^ {-1}(y){\ big)}、}
ベクトルからvectorEdit
上記の式は、他の複数の変数に応じて変数(yと呼びます)に一般化できます。f(x1、…、 xn)は、yが依存する変数の確率密度関数を示し、依存関係はy = g(x1、…、xn)となります。結果として得られる密度関数は、
∫y= g(x 1 、…、xn)f(x 1、…、xn)∑ j =1n∂g∂xj(x 1、…、xn)2 d V、{\ displaystyle \ int \ limその_ {y = g(x_ {1}、\ ldots、x_ {n})} {\ frac {f(x_ {1}、\ ldots、x_ {n})} {\ sqrt {\ sum _ {j = 1} ^ {n} {\ frac {\ partial g} {\ partial x_ {j}}}(x_ {1}、\ ldots、x_ {n})^ {2}}}} \、dV、}
ここで、積分は下付き方程式の(n − 1)次元の解全体にわたっており、シンボリックdVは、特定の計算のためにこの解のパラメーター化に置き換える必要があります。変数x1、…、xnは、もちろんこのパラメーター化の関数です。
これは、次の、おそらくより直感的な表現から導き出されます。xが同時密度fのn次元確率変数であるとします。 y = H(x)の場合、Hは全単射の微分可能関数であり、yの密度はgです。
g(y)= f(H − 1(y))| det | {\ displaystyle g(\ mathbf {y})= f {\ Big(} H ^ {-1}(\ mathbf {y}){\ Big)} \ left \ vert \ det \ left \ right \ vert}
微分をH(。)の逆行列のヤコビアンと見なし、yで評価します。
g(y 1、y 2)= f X 1、X 2(H 1 − 1(y 1、 y 2)、H 2 − 1(y 1、y 2))| ∂H1−1∂y1∂H2−1∂y2 −∂H 1 −1∂y2∂H2−1∂y1 | 。 {\ displaystyle g(y_ {1}、y_ {2})= f_ {X_ {1}、X_ {2}} {\ big(} H_ {1} ^ {-1}(y_ {1}、y_ { 2})、H_ {2} ^ {-1}(y_ {1}、y_ {2}){\ big)} \ left \ vert {\ frac {\ partial H_ {1} ^ {-1}} { \ partial y_ {1}}} {\ frac {\ partial H_ {2} ^ {-1}} {\ partial y_ {2}}}-{\ frac {\ partial H_ {1} ^ {-1}} {\ partial y_ {2}}} {\ frac {\ partial H_ {2} ^ {-1}} {\ partial y_ {1}}} \ right \ vert。}
ベクトルからscalarEdit
f Y(y)=∫RnfX(x)δ(y − V(x))dx。 {\ displaystyle f_ {Y}(y)= \ int _ {{\ mathbb {R}} ^ {n}} f_ {X}(\ mathbf {x})\ delta {\ big(} yV(\ mathbf { x}){\ big)} \、d \ mathbf {x}。}
この結果は、無意識の統計学者の法則につながります。
EY=∫RyfY(y)dy =∫R y∫RnfX(x)δ(y − V(x))dxdy =∫Rn∫RyfX(x)δ(y − V(x))dydx =∫RnV(x)f X( x)dx =EX。{\ displaystyle \ operatorname {E} _ {Y} = \ int _ {\ mathbb {R}} yf_ {Y}(y)dy = \ int _ {\ mathbb {R}} y \ int _ {{\ mathbb {R}} ^ {n}} f_ {X}(\ mathbf {x})\ delta {\ big(} yV(\ mathbf {x}){\ big)} \、d \ mathbf {x} dy = \ int _ {{\ mathbb {R}} ^ {n}} \ int _ {\ mathbb {R}} yf_ {X}(\ mathbf {x})\ delta {\ big(} yV(\ mathbf {x }){\ big)} \、dyd \ mathbf {x} = \ int _ {{\ mathbb {R}} ^ {n}} V(\ mathbf {x})f_ {X}(\ mathbf {x} )d \ mathbf {x} = \ operatorname {E} _ {X}。}
証明:
H(Z、X)= = {\ displaystyle H(Z、X)= {\ begin { bmatrix} Z + V(X)\\ X \ end {bmatrix}} = {\ begin {bmatrix} Y \\ {\ tilde {X}} \ end {bmatrix}}}。
H {\ displaystyle H}が全単射マッピングであり、H − 1 {\ displaystyle H ^ {-1}}のヤコビアンが次の式で与えられることは明らかです。
d H − 1(y、 x〜)dydx〜 = {\ displaystyle {\ frac {dH ^ {-1}(y、{\ tilde {\ mathbf {x}}})} {dy \、d {\ tilde {\ mathbf {x}} }}} = {\ begin {bmatrix} 1 &-{\ frac {dV({\ tilde {\ mathbf {x}}})} {d {\ tilde {\ mathbf {x}}}}} \\\ mathbf {0} _ {n \ times 1} & \ mathbf {I} _ {n \ times n} \ end {bmatrix }}}、
これは主対角線上に1がある上三角行列であるため、行列式は1です。前のセクションの変数定理の変更を適用すると、次のようになります。
f Y、X(y、 x)= f X(x)δ(y − V(x)){\ displaystyle f_ {Y、X}(y、x)= f_ {X}(\ mathbf {x})\ delta {\ big(} yV(\ mathbf {x}){\ big)}}、
x {\ displaystyle x}で周辺化すると、目的の確率密度関数になります。