この記事ではポアソン分布の希薄化(Thinning)をわかりやすく解説します。
ポアソン分布の希薄化とは、
二項分布とポアソン分布を混合し、二項分布の試行回数のパラメータをポアソン分布に従うように設定することです。
確率変数\(N\)はポアソン分布に従うとする。つまり\(N \sim Po(\lambda)\)とする。
パラメータ\(N, p\)の二項分布\(B(N, p)\)は\(Po(\lambda p)\)と一致する。
実際にこのことを、積率母関数が一致することにより確かめましょう。
一方、二項分布\(Z \sim B(n,p)\) の積率母関数は、
\begin{align} E(e^{tZ}) &= \sum_k e^{tk} {}_nC_k p^k (1-p)^{n-k} \\&= \sum_k {}_nC_k \left(e^{tk} p \right)^k (1-p)^{n-k} \\&= \left( 1 – p + pe^t\right)^n \end{align}
でした。
なので、今回の\(X \sim B(N,p)\)の積率母関数は、
\begin{align} E(e^{tX}) &= E_N(E_X(e^{tX} \mid N)) \\&= \sum_n \left( 1 – p + pe^t\right)^n e^{\lambda } \frac{\lambda^n}{n!} \\&= \sum_n e^{\lambda } \frac{ \left(\lambda \left( 1 – p + pe^t\right) \right)^n}{n!} \\&= \sum_n e^{\lambda } \frac{ e^{- \left( (1 – p + p e^t)\lambda \right)} }{ e^{- \left( (1 – p + p e^t)\lambda \right)}} \frac{ \left(\lambda \left( 1 – p + pe^t\right) \right)^n}{n!} \\&= e^{- \left( (1 – p + p e^t)\lambda – \lambda \right)} \\&= e^{- \left( (- p + p e^t)\lambda \right)} \\&= e^{- \lambda p (e^t -1 )} \end{align}
こうなります。ただし\(E_X, E_N\)はそれぞれ\(X, N\)について期待値をとる操作を表しています。
ここで、ポアソン分布\(Y \sim Po(\lambda)\)の積率母関数を思い出すと、
\begin{align}E(e^{tY}) &= \sum_{k} e^{tk} e^{- \lambda } \frac{\lambda^k}{k!} \\ &= \sum_k e^{- \lambda} \frac{\left( e^t \lambda \right) ^k }{k!} \\&= \sum_k e^{- \lambda} \frac{e^{-{e^t \lambda } }}{e^{-{e^t \lambda } }} \frac{\left( e^t \lambda \right) ^k }{k!} \\&= e^{\lambda(e^t -1)} \end{align}
でした。
なので、
\begin{align*}e^{- \lambda p (e^t -1 )} \end{align*}
はポアソン分布\(Po(\lambda p)\)の積率母関数ということがわかります。
これはすなわち
パラメータ\(N, p\)の二項分布\(B(N, p)\)は\(Po(\lambda p)\)と一致することを意味しています。
コメント