線形回帰モデルで制限付きモデルとの残差平方和の差がカイ二乗分布に従うことを証明！！！

2025年2月16日2025年2月23日

この記事では線形回帰モデルで制限付きモデルとの残差平方和の差がカイ二乗分布に従うことを証明します。

線形回帰モデルの設定

$\begin{array}{r} y = X β + ε, ε \sim N (0, σ^{2} I) \end{array}$
という線形回帰モデルを考えます。 $X$ は1列目が全て1の $n \times p + 1$ 行列です。
また、 $β = (β_{0}, β_{1}, \dots, β_{p})^{t} \in R^{p + 1}$ という添字の振り方をしているとします。

例えば帰無仮説
$\begin{array}{r} h_{0} : β_{k} = β_{k + 1} = \dots = 0 \end{array}$
を考えてみます。(後述のハット行列 $H$ と表記がややこしくなるので、小文字の $h$ で帰無仮説を表記しています）。

$\begin{aligned} X_{f} & = X \end{aligned}$
と表記することにします。また、 $X$ の $k$ 列以降を全て0ベクトルとしたベクトルを $X_{r}$ とします。つまり、
$\begin{array}{r} {\tilde{X}}_{r} = X [\begin{array}{c} I_{k} & 0 \\ 0 & 0 \end{array}] \end{array}$
です。ついでに、 $X$ を最初の $k$ 列とそれ以降を分けて表記します。つまり、
$\begin{array}{r} X = [\begin{array}{c} X_{r} & X_{e} \end{array}] \end{array}$
により $X_{r}, X_{e}$ を定めます。

また、
$\begin{array}{r} β_{f} = β \end{array}$
とし、
$\begin{array}{r} {\tilde{β}}_{r} = [\begin{array}{c} I_{k} & 0 \\ 0 & 0 \end{array}] β \end{array}$
とします。ついでに最初の $k$ 行とそれ以降を分けて表記します。つまり、
$\begin{array}{r} β = [\begin{array}{c} β_{r} \\ β_{e} \end{array}] \end{array}$

ここで、
$\begin{array}{r} {\tilde{X}}_{r} = [\begin{array}{c} X_{r} & 0 \end{array}] \end{array}$
と、
$\begin{array}{r} {\tilde{β}}_{r} = [\begin{array}{c} β_{r} \\ 0 \end{array}] \end{array}$
という関係になっています。

帰無仮説の下では、
$\begin{array}{r} y = X_{f} {\tilde{β}}_{r} + ε, ε \sim N (0, σ^{2} I) \end{array}$
と仮定していることになります。
$\begin{array}{r} H_{f} = X_{f} {(X_{f}^{t} X_{f})}^{- 1} X_{f}^{t} \end{array}$
とします。
$\begin{array}{r} H_{r} = X_{r} {(X_{r}^{t} X_{r})}^{- 1} X_{r}^{t} \end{array}$
と定めます。一応 $H_{f}, H_{r}$ はともに $n$ 次正方行列です。

残差平方和の差分

一般に、線形回帰モデルの残差平方和
$\begin{array}{r} \sum (y_{i} - {\hat{y}}_{i})^{2} \end{array}$
は行列で表記すると、
$\begin{array}{r} y^{t} (I - H) y \end{array}$
でした。
$\begin{array}{r} R S S_{f} = y^{t} (I - H_{f}) y \end{array}$
とし、
$\begin{array}{r} R R S_{r} = y^{t} (I - H_{r}) y \end{array}$
とします。これらの差を考えます。
$\begin{array}{r} R R S_{f} - R R S_{r} = y^{t} (I - H_{f}) y - y^{t} (I - H_{r}) y = y^{t} (H_{f} - H_{r}) y \end{array}$
です。

$\begin{aligned} X_{f} β_{f} & = X_{f} [\begin{array}{c} I_{k} & 0 \\ 0 & 0 \end{array}] β \\ = X_{f} [\begin{array}{c} I_{k} & 0 \\ 0 & 0 \end{array}] [\begin{array}{c} I_{k} & 0 \\ 0 & 0 \end{array}] β \\ = {\tilde{X}}_{r} {\tilde{β}}_{r} \end{aligned}$
であり、
$\begin{array}{r} {\tilde{X}}_{r} {\tilde{β}}_{r} = X_{r} β_{r} \end{array}$
ということを念頭に置いておきます（すみません極めて当たり前かもしれないで）。つまり、
$\begin{array}{r} X_{f} β_{f} = X_{r} β_{r} \end{array}$

$\begin{aligned} y^{t} H_{f} y & = β_{f} X_{f}^{t} H_{f} X_{f} β_{f} + ε^{t} H_{f} X_{f} β_{f} + β_{f}^{t} X_{f}^{t} H_{f} ε + ε^{t} H_{f} ε \\ = β_{f} X_{f}^{t} X_{f} β_{f} + ε^{t} X_{f} β_{f} + β_{f}^{t} X_{f}^{t} ε + ε^{t} H_{f} ε \\ = β_{r} X_{r}^{t} X_{r} β_{r} + ε^{t} X_{r} β_{r} + β_{r}^{t} X_{r}^{t} ε + ε^{t} H_{f} ε \end{aligned}$
です。ただし $H_{f} X_{f} = X_{f}$ や $X_{f} β_{f} = X_{r} β_{r}$ をところどころ用いています。
また同様に、
$\begin{aligned} y^{t} H_{r} y & = β_{r} X_{r}^{t} H_{r} X_{r} β_{r} + ε^{t} H_{r} X_{r} β_{r} + β_{r}^{t} X_{r}^{t} H_{r} ε + ε^{t} H_{r} ε \\ = β_{r} X_{r}^{t} H_{r} X_{r} β_{r} + ε^{t} H_{r} X_{r} β_{r} + β_{r}^{t} X_{r}^{t} H_{r} ε + ε^{t} H_{r} ε \\ = β_{r} X_{r}^{t} X_{r} β_{r} + ε^{t} X_{r} β_{r} + β_{r}^{t} X_{r}^{t} ε + ε^{t} H_{r} ε \end{aligned}$
となります。というわけで、
$\begin{aligned} y^{t} (H_{f} - H_{r}) y & = ε^{t} (H_{f} - H_{r}) ε \end{aligned}$
となります。

$\begin{array}{r} \frac{1}{σ} ε \end{array}$
を考えることにします。つまり、
$\begin{array}{r} \frac{1}{σ} ε \sim N (0, I) \end{array}$
ですので、多変量標準正規分布です。
$(H_{f} - H_{r})$ は階数 $p + 1 - k$ の実対称冪等行列であることがわかります。
適当に直交行列 $S \in O_{n}$ で対角化することで、
$\begin{array}{r} (H_{f} - H_{r}) = S^{t} Λ_{p + 1 - k} S \end{array}$
とすることができます。ただし、
$\begin{array}{r} Λ_{p} = [\begin{array}{c} I_{p + 1 - k} & 0 \\ 0 & 0 \end{array}] \end{array}$
という表記を用いています。
$\begin{aligned} \frac{1}{σ} ε^{t} (H_{f} - H_{r}) \frac{1}{σ} ε & = \frac{1}{σ} ε^{t} S^{t} Λ_{p + 1 - k} S \frac{1}{σ} ε \end{aligned}$
とできます。
$\begin{array}{r} S \frac{1}{σ} ε \end{array}$
は多変量標準正規分布の直交行列による変換なので多変量標準正規分布に従います。
というわけで、
$\begin{array}{r} \frac{1}{σ} ε^{t} S^{t} Λ_{p + 1 - k} S \frac{1}{σ} ε \end{array}$
は標準正規分布の2乗の $p + 1 - k$ 個の和なので自由度 $p + 1 - k$ のカイ二乗分布に従います。
というわけで、帰無仮説の下で
$\begin{array}{r} \frac{1}{σ^{2}} (y^{t} (I - H_{f}) y - y^{t} (I - H_{r}) y) \sim χ_{p + 1 - k} \end{array}$
ということが分かります。

命題

線形回帰モデルを、
$\begin{array}{r} y = X β + ε, ε \sim N (0, σ^{2} I) \end{array}$
とする。帰無仮説
$\begin{array}{r} h_{0} : β_{k} = β_{k + 1} = \dots = 0 \end{array}$
の下で、
$\begin{array}{r} \frac{1}{σ^{2}} (R S S_{f} - R S S_{r}) \sim χ_{p + 1 - k} \end{array}$
が成り立つ。

回帰平方和との関係

回帰平方和は
$\begin{array}{r} E S S = \sum {({\hat{y}}_{i} - {\bar{y}}_{i})}^{2} \end{array}$
により定義されますが、これを行列の表記に一旦直してみます。
$\begin{array}{r} e = (1, 1, \dots, 1)^{t} \in R^{n} \end{array}$
と表記することにすると、
$\begin{array}{r} E S S = \sum {({\hat{y}}_{i} - {\bar{y}}_{i})}^{2} = y^{t} (H - \frac{1}{n} e e^{t}) y \end{array}$
であることが分かります。 $E S S_{f} = y^{t} (H_{f} - \frac{1}{n} e e^{t}) y$ と表記することにします。
というのも、
$\begin{array}{r} \hat{y} = \frac{1}{n} e e^{t} y \end{array}$
だからです。ここで、帰無仮説として切片 $β_{0}$ 以外の回帰係数が全て $0$ であるという帰無仮説を考えてみます。
つまり、
$\begin{array}{r} h_{0} : β_{1} = β_{2} = \dots = β_{p} = 0 \end{array}$
ということです。
$\begin{array}{r} X_{r} = [\begin{array}{c} 1 \\ 1 \\ ⋮ \\ 1 \end{array}] \end{array}$
と定めます。
$\begin{aligned} H_{r} & = X_{r} {(X_{r}^{t} X_{r})}^{- 1} X_{r}^{t} \\ = X_{r} \frac{1}{n} X_{r}^{t} \\ = \frac{1}{n} e e^{t} \end{aligned}$
となります。
つまり、帰無仮説において
$\begin{array}{r} R S S_{f} - R S S_{r} = E S S_{f} \end{array}$
であることがわかります。