更新:2024/09/11

標本分散と不偏分散の定義・不偏推定量・例題について

はるか
はるか
標本分散って、不偏推定量じゃないんだ。
ふゅか
ふゅか
そうね!不偏分散は、その点で違うのよ。サンプルデータから母集団の分散を推定するために、不偏分散を使うの。

1. 標本分散とは

標本分散S2S^2は次のように定義される。

S2=1ni=1n(xixˉ)2 S^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2

標本分散は母分散の不偏推定量ではないです。

  • nn はサンプルの大きさ(データの個数)
  • xix_i は各データの値
  • xˉ\bar{x} はサンプルの平均(標本平均)

2. 不偏分散とは

不偏分散は、サンプルデータから母集団の分散を推定するときに使用されます。

不偏分散の定義は次のようになります。

s2=1n1i=1n(xixˉ)2 s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2

  • nn はサンプルの大きさ(データの個数)
  • xix_i は各データの値
  • xˉ\bar{x} はサンプルの平均(標本平均)

3. 不偏分散の性質

3.1. 母分散の不偏推定量

不偏分散σ^2\hat{\sigma}^2 は母分散 σ2\sigma^2不偏推定量である。

E[σ^2]=σ2\mathbb{E}[\hat{\sigma}^2 ] = \sigma^2

まず、母分散 σ2\sigma^2 は以下の式で定義されます。

σ2=E[(Xμ)2] \sigma^2 = \mathbb{E}\left[(X - \mu)^2\right]

ここで、μ=E[X]\mu = \mathbb{E}[X] は母平均、E\mathbb{E} は期待値を表しています。

標本分散は次の式で定義されます。

S2=1ni=1n(XiXˉ)2 S^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2

ここで、Xˉ=1ni=1nXi\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i標本平均XiX_i は観測値、nn は標本数(サンプル数)です。

不偏分散は次の式で定義されます。

σ^2=1n1i=1n(XiXˉ)2 \hat{\sigma}^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2

不偏分散が母分散の不偏推定量であるとは、期待値 E[σ^2]=σ2\mathbb{E}[\hat{\sigma}^2] = \sigma^2 であることを示すことです。

まず、標本平均 Xˉ\bar{X} の性質を考えます。

Xˉ=1ni=1nXi \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i

標本平均 Xˉ\bar{X} の期待値は母平均に等しいことが知られています。

E[Xˉ]=μ \mathbb{E}[\bar{X}] = \mu

次に、i=1n(XiXˉ)2\sum_{i=1}^n (X_i - \bar{X})^2 の期待値を計算します。このために、標本分散の式を展開します。

i=1n(XiXˉ)2=i=1n((Xiμ)(Xˉμ))2 \sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n \left( (X_i - \mu) - (\bar{X} - \mu) \right)^2

これを展開すると、次の3つの項に分けられます。

=i=1n(Xiμ)22(Xˉμ)i=1n(Xiμ)+n(Xˉμ)2 = \sum_{i=1}^n (X_i - \mu)^2 - 2(\bar{X} - \mu)\sum_{i=1}^n (X_i - \mu) + n(\bar{X} - \mu)^2

ここで、i=1n(Xiμ)=n(Xˉμ)\sum_{i=1}^n (X_i - \mu) = n(\bar{X} - \mu) であるため、

i=1n(XiXˉ)2=i=1n(Xiμ)2n(Xˉμ)2 \sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n (X_i - \mu)^2 - n(\bar{X} - \mu)^2

期待値を取ると、E[(Xiμ)2]=σ2\mathbb{E}[(X_i - \mu)^2] = \sigma^2 なので、

E[i=1n(XiXˉ)2]=nσ2E[n(Xˉμ)2] \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = n\sigma^2 - \mathbb{E}[n(\bar{X} - \mu)^2]

標本平均の分散V(Xˉ)=σ2n\text{V}(\bar{X}) = \frac{\sigma^2}{n} なので、

E[(Xˉμ)2]=V(Xˉ)=σ2n \mathbb{E}[(\bar{X} - \mu)^2] = \text{V}(\bar{X})=\frac{\sigma^2}{n}

これを用いると、

E[i=1n(XiXˉ)2]=nσ2nσ2n=(n1)σ2 \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = n\sigma^2 - n \cdot \frac{\sigma^2}{n} = (n-1)\sigma^2

したがって、不偏分散 σ^2\hat{\sigma}^2 の期待値は、

E[σ^2]=1n1E[i=1n(XiXˉ)2]=1n1(n1)σ2=σ2 \mathbb{E}[\hat{\sigma}^2] = \frac{1}{n-1} \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = \frac{1}{n-1} \cdot (n-1)\sigma^2 = \sigma^2

これにより、不偏分散は母分散の不偏推定量であることが示されました。

4. 例題

ふゅか
ふゅか
じゃあ、具体的に例を使って説明してみるね。例えば、プロジェクトの収益を考えるよ。
はるか
はるか
うん、収益データを使う。A: 150, B: 200, C: 250, D: 300, E: 350。

4.1. 例題1:プロジェクトの収益

ある会社が以下の5つのプロジェクトからの収益を記録しました。それぞれの収益は次の通りです(単位は万円)。

  • プロジェクトA: 150
  • プロジェクトB: 200
  • プロジェクトC: 250
  • プロジェクトD: 300
  • プロジェクトE: 350

この5つのプロジェクトから得られた収益の不偏分散を計算してください。

収益のデータをすべて足して平均を求めます。

平均 xˉ\bar{x} は次の式で計算されます。

xˉ=150+200+250+300+3505=12505=250 \bar{x} = \frac{150 + 200 + 250 + 300 + 350}{5} = \frac{1250}{5} = 250

各プロジェクトの収益から平均を引いて偏差を計算します。

  • プロジェクトA: 150250=100150 - 250 = -100
  • プロジェクトB: 200250=50200 - 250 = -50
  • プロジェクトC: 250250=0250 - 250 = 0
  • プロジェクトD: 300250=50300 - 250 = 50
  • プロジェクトE: 350250=100350 - 250 = 100

各偏差を二乗します。

  • プロジェクトA: (100)2=10000(-100)^2 = 10000
  • プロジェクトB: (50)2=2500(-50)^2 = 2500
  • プロジェクトC: 02=00^2 = 0
  • プロジェクトD: 502=250050^2 = 2500
  • プロジェクトE: 1002=10000100^2 = 10000

二乗した偏差を合計します。

10000+2500+0+2500+10000=25000 10000 + 2500 + 0 + 2500 + 10000 = 25000

不偏分散は次の式で計算されます。

s2=1n1i=1n(xixˉ)2 s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2

ここで、n=5n = 5 ですから、

s2=2500051=250004=6250 s^2 = \frac{25000}{5 - 1} = \frac{25000}{4} = 6250

この会社のプロジェクト収益の不偏分散は 625026250万円^2 です。

4.2. 例題2:魔法の成功回数

ある魔法学校の生徒たちは、試験で以下の5種類の魔法を使用してみました。それぞれの魔法を成功させた回数(単位は回数)は次の通りです:

  • 魔法A(火の魔法): 10回
  • 魔法B(水の魔法): 15回
  • 魔法C(風の魔法): 20回
  • 魔法D(土の魔法): 25回
  • 魔法E(光の魔法): 30回

この5種類の魔法の成功回数の不偏分散を計算してください。

成功回数のデータをすべて足して平均を求めます。

平均 xˉ\bar{x} は次の式で計算されます。

xˉ=10+15+20+25+305=1005=20 \bar{x} = \frac{10 + 15 + 20 + 25 + 30}{5} = \frac{100}{5} = 20

各魔法の成功回数から平均を引いて偏差を計算します。

  • 魔法A: 1020=1010 - 20 = -10
  • 魔法B: 1520=515 - 20 = -5
  • 魔法C: 2020=020 - 20 = 0
  • 魔法D: 2520=525 - 20 = 5
  • 魔法E: 3020=1030 - 20 = 10

各偏差を二乗します。

  • 魔法A: (10)2=100(-10)^2 = 100
  • 魔法B: (5)2=25(-5)^2 = 25
  • 魔法C: 02=00^2 = 0
  • 魔法D: 52=255^2 = 25
  • 魔法E: 102=10010^2 = 100

二乗した偏差を合計します。

100+25+0+25+100=250 100 + 25 + 0 + 25 + 100 = 250

不偏分散は次の式で計算されます。

s2=1n1i=1n(xixˉ)2 s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2

ここで、n=5n = 5 ですから、

s2=25051=2504=62.5 s^2 = \frac{250}{5 - 1} = \frac{250}{4} = 62.5

魔法の成功回数の不偏分散は62.52 62.5回^2 です。

PR