カイ(χ)2乗分布について!ガンマ関数と確率密度関数の関連性

ふゅか
ふゅか
今日はχ²分布について話すよ♪

1. χ²分布とは

χ²分布の確率変数は、k個の独立した標準正規分布(平均0、分散1)の二乗和の分布です。つまり、Z₁, Z₂, …, Zₖを独立した標準正規分布に従う確率変数とすると、χ²分布は次のように定義されます。

\[ X = Z_1^2 + Z_2^2 + \cdots + Z_k^2 \]

このXは自由度kのχ²分布に従います。

はるか
はるか
χ²分布は、k個の独立した標準正規分布の二乗和の分布。
ふゅか
ふゅか
そうそう!標準正規分布って、平均0、分散1の分布だよね。それらを二乗して合計するのがχ²分布になるの。

1.1. 基本的な性質

  • 自由度 (degrees of freedom, df): χ²分布は自由度(df)というパラメータによって特徴づけられます。自由度は、観測データの数を制約条件として表します。
  • 形状: 自由度が1のときは右に尖った形状をしており、分布の形状が右に広がり、常に正の値しか取りません。

2. χ²分布の確率密度関数(PDF)

自由度 \( k \) の χ²分布の確率密度関数は次の式で表されます。

\[ \large f(x; k) = \begin{cases} \frac{1}{2^{\frac{k}{2}} \Gamma(\frac{k}{2})} x^{\frac{k}{2} - 1} e^{-\frac{x}{2}} & (x > 0)  \\ 0 & (x \leq 0) \end{cases} \]

ここで、

  • \( x \) は非負の実数( \( x \geq 0 \) )。
  • \( k \) は自由度。
  • \( \Gamma \) はガンマ関数です。特に、自然数 \( n \) に対して、 \( \Gamma(n) = (n-1)! \)。

2.1. ガンマ関数

ガンマ関数 \( \Gamma(z) \) は次のように定義されます。

\[ \Gamma(z) = \int_0^\infty t^{z-1} e^{-t} \, dt \]

2.2. 自由度k=2のときの例

例えば、自由度 \( k = 2 \) の場合、確率密度関数は次のようになります。

\[ f(x; 2) = \frac{1}{2 \Gamma(1)} x^{1-1} e^{-x/2} \]

ここで、\( \Gamma(1) = 1 \) ですので、

\[ f(x; 2) = \frac{1}{2} e^{-\frac{x}{2}} \]

これは指数分布の$\lambda=\frac{1}{2}$の確率密度関数と一致します。

2.3. プロット

自由度によって異なる形状の確率密度関数をプロットすると、χ²分布の性質がわかりやすくなります。自由度が増えるにつれて、分布の形状が右に広がります。

はるか
はるか
自由度によって異なる形状の確率密度関数をプロットすると、χ²分布の性質がわかりやすい。
ふゅか
ふゅか
自由度が増えるにつれて、分布の形状が右に広がるのが見て取れるわね。

3. 期待値と分散

自由度を \( n \) とした場合、カイ二乗分布 \( \chi^2(n) \) の期待値と分散は以下のようになります。

  • 期待値: \( E[X] = n \)
  • 分散: \( \mathrm{Var}(X) = 2n \)

以下、2通りの方法で導出を示します。

4. モーメント母関数を用いる方法

カイ二乗分布のモーメント母関数は

\[ M_X(t) = E[e^{tX}] = (1-2t)^{-n/2}, \quad t < \frac{1}{2}, \]

と表されます。

4.1. 期待値の導出

まず \( M_X(t) \) の1階微分 \( M’_X(t) \) を求めます。対数を取ってから微分すると、

\[ \ln M_X(t) = -\frac{n}{2} \ln(1-2t) \]

これを \(t\) で微分すると、

\[ \frac{M’_X(t)}{M_X(t)} = -\frac{n}{2} \cdot \frac{-2}{1-2t} = \frac{n}{1-2t} \]

よって、

\[ M’_X(t) = \frac{n}{1-2t}\, M_X(t) \]

\(t=0\) で評価すると、

\[ E[X] = M’_X(0) = \frac{n}{1} \cdot M_X(0) = n \]

4.2. 分散の導出

次に、2階微分 \( M”_X(t) \) を求めて \( E[X^2] = M”_X(0) \) を計算します。

すでに求めた1階微分は

\[ M’_X(t) = \frac{n}{1-2t} (1-2t)^{-n/2} = n (1-2t)^{-n/2-1} \]

これを \(t\) で微分すると、

\[ M”_X(t) = n\left(-\left(\frac{n}{2}+1\right)\right)(-2)(1-2t)^{-n/2-2} \]

整理すると、

\[ M”_X(t) = 2n\left(\frac{n}{2}+1\right)(1-2t)^{-n/2-2} = n(n+2) (1-2t)^{-n/2-2} \]

\(t=0\) で評価すると、

\[ E[X^2] = M”_X(0) = n(n+2) \]

よって、分散は

\[ \mathrm{Var}(X) = E[X^2] - (E[X])^2 = n(n+2) - n^2 = 2n \]

5. ガンマ分布としての性質を利用する方法

カイ二乗分布は、形状パラメータ \(\alpha = \frac{n}{2}\) と尺度パラメータ \(\beta = 2\) のガンマ分布 \(\Gamma(\alpha,\beta)\) に一致します。ガンマ分布の場合、

  • 期待値: \[ E[X] = \alpha \beta, \]
  • 分散: \[ \mathrm{Var}(X) = \alpha \beta^2, \]

となるので、\(\alpha = \frac{n}{2}\) および \(\beta = 2\) を代入すると、

  • 期待値: \[ E[X] = \frac{n}{2} \times 2 = n, \]
  • 分散: \[ \mathrm{Var}(X) = \frac{n}{2} \times 2^2 = 2n \]
PR