統計学や確率論において、ポアソン分布はランダムな事象の発生をモデル化する際に非常に重要な確率分布です。特に、一定の時間や空間内での稀な事象の発生回数を扱う場合によく用いられます。
本記事では、ポアソン分布の最頻値(モード)の求め方について、できるだけわかりやすく詳しく解説します。
最頻値は確率分布において最も頻繁に観測される値、すなわち確率密度関数が最大となる点を指します。
確率分布における最頻値とは、確率が最大となる値のことです。
つまり、\(f\)を密度関数とする確率変数の最頻値とは、
\begin{align*} \text{argmax} f(x)\end{align*}
です。念の為に補足しておくと、
\begin{align*} \textrm{argmax} f(x) = \{x \mid f(x ^\prime) \leq f(x) \quad (\forall x^\prime \in \mathbb R) \} \end{align*}
です。つまり、最大値を実現する\(x\)です。
確率変数\(X\)がポアソン分布\(Po(\lambda)\)に従うとします。
このとき、最頻値(mode)は、
\begin{align*} \textrm{mode} X = \text{min} \{0 \leq k \mid \frac{P(X = k+1)}{P(X = k)} \leq 1 \} \end{align*}
です。ただし、
\begin{align*} \frac{P(X = k+1)}{P(X = k)} = 1 \end{align*}
となる\(k\)が存在する場合には、最頻値は\(k, k+1\)の両方です。
\(X \sim Po(\lambda)\)のとき、
\begin{align*} P(X = k) = e^{-\lambda} \frac{\lambda^k}{k!} \end{align*}
であるので、
\begin{align*} \frac{P(X = k+1)}{P(X = k)} &= \frac{e^{-\lambda} \frac{\lambda^{k+1}}{(k+1)!}}{e^{-\lambda} \frac{\lambda^k}{k!}} \\&= \frac{\lambda}{k+1} \end{align*}
と計算することができます。
従ってより具体的には、
確率変数\(X\)が二項分布\(Po(\lambda)\)に従うとします。
このとき、最頻値(mode)は、
\begin{align*} \textrm{mode} X = \text{min} \{ 0 \leq k \mid \frac{\lambda}{k+1} \leq 1 \} \end{align*}
です。ただし、
\begin{align*} \frac{\lambda}{k+1} = 1 \end{align*}
のときには\(k, k+1\)の両方が最頻値です。
ポアソン分布の最頻値の求め方について、ステップバイステップで解説しました。最頻値を理解することで、ポアソン分布の形状やデータの中心傾向を把握しやすくなります。統計学やデータ分析を行う上で、これらの概念をしっかりと理解しておくことは非常に重要です。
もしこの記事が役に立ったと思われたら、ぜひ他の方にもシェアしてください。また、ご質問やご感想がありましたら、お気軽にコメント欄にお寄せください。
コメント