標準正規分布をカイ二乗分布のルートで割るとt分布が導出できることの証明

この記事では、標準正規分布をカイ二乗分布のルートで割るとt分布が導出できることをわかりやすく解説します。

定義:t分布

自由度\(n\)のt分布とは、確率密度関数が
\begin{align*} f(x) = \frac{1}{\sqrt{n \pi}} \frac{\Gamma(\frac{n+1}{2})}{\Gamma(\frac{n}{2})} \left( \frac{n}{x^2 + n} \right)^{\frac{n+1}{2}} \end{align*}
で与えられる分布でした。

t分布を導出する前に、標準正規分布とカイ二乗分布を思い出しておきます。
標準正規分は確率密度関数が
\begin{align*} f(x) = \frac{1}{\sqrt{2\pi}}e^{\frac{x^2}{2}} \end{align*}
で与えられる分布でした。また、自由度\(n\)のカイ二乗分布は、確率密度関数が、
\begin{align*} f(x) = \begin{cases} \frac{\left( \frac{1}{2}\right)^{\frac{n}{2}} x^{\frac{n}{2} – 1 } e^{ – \frac{1}{2} x}}{\Gamma(\frac{n}{2})} &(0 \leq x) \\ 0 & (x <0) \end{cases} \end{align*}
で与えられる分布でした。

次の命題が成立します。これは、t分布・正規分布・カイ二乗分布の関係性を示すような命題になっています。

命題:t分布の導出

\(X\)を標準正規分布に従う確率変数、\(Y\)を自由度\(n\)のカイ二乗分布に従う確率変数とする。
このとき、
\begin{align*} \frac{X }{\sqrt{\frac{Y}{n}} }\end{align*}
は自由度\(n\)のt分布に従う。

実際にこれを確かめてみましょう。
\begin{align*} Z = \frac{X}{\sqrt{\frac{Y}{n}}}, \quad W = Y\end{align*}
として\(Z, Y\)を定めます。
\(X, Y\)の同時確率密度関数を\(f_{X, Y}\)で表記することにし、\(Z\)の確率密度関数を\(f_Z\)で表記することにします。\(f_Z(z) = \partial_z P(Z \leq z)\)なので、
\begin{align*} f_Z (z) = \partial_z \int_{\frac{x}{\sqrt{\frac{y}{n}}} \leq z} f_{X,Y}(x, y) dx dy \end{align*}
となります。\(X, Y\)は独立なので、それぞれの確率密度関数を\(f_X, f_Y\)で表記すると、\(f_{X, Y} = f_X f_Y\) なので
\begin{align*} f_{X, Y}(x, y) = f_X(x) f_Y(x) = \begin{cases} \frac{1}{\sqrt{2\pi}}e^{\frac{x^2}{2}} \frac{\left( \frac{1}{2}\right)^{\frac{n}{2}} y^{\frac{n}{2} – 1 } e^{ – \frac{1}{2} y}}{\Gamma(\frac{n}{2})} &(0 \leq y) \\ 0 & (y <0) \end{cases} \end{align*}
となります。\((x, y)\)を\((z, w)\)に変数変換します。ヤコビアンは、ちょっと計算すると、\(\sqrt{\frac{w}{n}}\)であることがわかります。
\begin{align*}\partial_z \int_{\frac{X}{\sqrt{\frac{Y}{n}}} \leq z} f_{X,Y}(x, y) dx dy = \int_{0}^\infty \frac{1}{\sqrt{2\pi}}e^{\frac{\left(z \frac{w}{n} \right)^2}{2}} \frac{\left( \frac{1}{2}\right)^{\frac{n}{2}} w^{\frac{n}{2} – 1 } e^{ – \frac{1}{2} w}}{\Gamma(\frac{n}{2})} \sqrt{\frac{w}{n}} dw
\end{align*}
(ちょっと変形がわかりにくいかもしれませんが、一般に\(\partial_u \int_0^u f(s) ds = f(u)\)となることを用いているので\(z\)に関する積分は最終的には出なくて\(w\)関する積分だけ残っているような状態になります。また、\(y\)は正の値しかとらないので、それに対応するように\(w\)の積分範囲も正の部分だけになるようになっています。)

計算を進めます。見やすくするために、
\begin{align*} A = \frac{z^2}{n} + 1, \quad \alpha = \frac{1}{2} A\end{align*}
と記号を定め、式変形の途中で該当部分をこの記号に置き換えます。

\begin{align*}\int_{0}^\infty \frac{1}{\sqrt{2\pi}}e^{\frac{\left(z \frac{w}{n} \right)^2}{2}} \frac{\left( \frac{1}{2}\right)^{\frac{n}{2}} w^{\frac{n}{2} – 1 } e^{ – \frac{1}{2} w}}{\Gamma(\frac{n}{2})} \sqrt{\frac{w}{n}} dw
&= \frac{\frac{1}{2} ^{\frac{n}{2}}}{\sqrt{n2\pi}\Gamma(\frac{n}{2})} \int_0^\infty e^{- \frac{1}{2} \left( \frac{z^2}{n} + 1\right) w} w^{\frac{n}{2} – \frac{1}{2}} dw
\\&= \frac{\frac{1}{2} ^{\frac{n}{2}}}{\sqrt{n2\pi}\Gamma(\frac{n}{2})} \int_0^\infty e^{- \alpha w} w^{\frac{n}{2} – \frac{1}{2}} dw
\\& = \frac{\frac{1}{2} ^{\frac{n}{2}}}{\sqrt{n2\pi}\Gamma(\frac{n}{2})} \int_0^\infty e^{- \xi } \left( \frac{\xi}{\alpha} \right)^{\frac{n}{2} – \frac{1}{2}} \frac{1}{\alpha}d\xi
\\& = \frac{\frac{1}{2} ^{\frac{n}{2}}}{\sqrt{n2\pi}\Gamma(\frac{n}{2})} \left(\frac{1}{\alpha} \right)^{\frac{n}{2} + \frac{1}{2}} \int_0^\infty e^{- \xi } \xi^{\frac{n}{2} – \frac{1}{2}} d\xi
\\& = \frac{\frac{1}{2} ^{\frac{n}{2}}}{\sqrt{n2\pi}\Gamma(\frac{n}{2})} \left(\frac{1}{\alpha} \right)^{\frac{n}{2} + \frac{1}{2}} \Gamma(\frac{n}{2} + \frac{1}{2})
\\&= \frac{\frac{1}{2} ^{\frac{n}{2} + \frac{1}{2} }}{\sqrt{n\pi}\Gamma(\frac{n}{2})} \left(\frac{2}{A} \right)^{\frac{n}{2} + \frac{1}{2}} \Gamma(\frac{n}{2} + \frac{1}{2})
\\&= \frac{1}{\sqrt{n\pi}\Gamma(\frac{n}{2})} \left(\frac{1}{A} \right)^{\frac{n}{2} + \frac{1}{2}} \Gamma(\frac{n}{2} + \frac{1}{2})
\\&=\frac{\Gamma(\frac{n}{2} + \frac{1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})} \left(\frac{n}{z^2 + n} \right)^{\frac{n}{2} + \frac{1}{2}}
\\&= \frac{1}{\sqrt{n\pi}}\frac{\Gamma(\frac{n+1}{2})}{\Gamma(\frac{n}{2})} \left(\frac{n}{z^2 + n} \right)^{\frac{n+1}{2}} \end{align*}
となり、確かに自由度\(n\)のt分布の確率密度関数と一致していることが確かめられました。

記事をシェアして話のネタにする

コメント

コメントする

目次