更新:2024/09/11

標本分散と不偏分散の定義・不偏推定量・例題について

はるか
はるか
標本分散って、不偏推定量じゃないんだ。
ふゅか
ふゅか
そうね!不偏分散は、その点で違うのよ。サンプルデータから母集団の分散を推定するために、不偏分散を使うの。

1. 標本分散とは

標本分散$S^2$は次のように定義される。

\[ S^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]

標本分散は母分散の不偏推定量ではないです。

  • \(n\) はサンプルの大きさ(データの個数)
  • \(x_i\) は各データの値
  • \(\bar{x}\) はサンプルの平均(標本平均)

2. 不偏分散とは

不偏分散は、サンプルデータから母集団の分散を推定するときに使用されます。

不偏分散の定義は次のようになります。

\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]

  • \(n\) はサンプルの大きさ(データの個数)
  • \(x_i\) は各データの値
  • \(\bar{x}\) はサンプルの平均(標本平均)

3. 不偏分散の性質

3.1. 母分散の不偏推定量

不偏分散$\hat{\sigma}^2 $は母分散 \(\sigma^2\)の不偏推定量である。

$$\mathbb{E}[\hat{\sigma}^2 ] = \sigma^2$$

まず、母分散 \(\sigma^2\) は以下の式で定義されます。

\[ \sigma^2 = \mathbb{E}\left[(X - \mu)^2\right] \]

ここで、\(\mu = \mathbb{E}[X]\) は母平均、\(\mathbb{E}\) は期待値を表しています。

標本分散は次の式で定義されます。

\[ S^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2 \]

ここで、\(\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i\) は標本平均、\(X_i\) は観測値、\(n\) は標本数(サンプル数)です。

不偏分散は次の式で定義されます。

\[ \hat{\sigma}^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2 \]

不偏分散が母分散の不偏推定量であるとは、期待値 \(\mathbb{E}[\hat{\sigma}^2] = \sigma^2\) であることを示すことです。

まず、標本平均 \(\bar{X}\) の性質を考えます。

\[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]

標本平均 \(\bar{X}\) の期待値は母平均に等しいことが知られています。

\[ \mathbb{E}[\bar{X}] = \mu \]

次に、\(\sum_{i=1}^n (X_i - \bar{X})^2\) の期待値を計算します。このために、標本分散の式を展開します。

\[ \sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n \left( (X_i - \mu) - (\bar{X} - \mu) \right)^2 \]

これを展開すると、次の3つの項に分けられます。

\[ = \sum_{i=1}^n (X_i - \mu)^2 - 2(\bar{X} - \mu)\sum_{i=1}^n (X_i - \mu) + n(\bar{X} - \mu)^2 \]

ここで、\(\sum_{i=1}^n (X_i - \mu) = n(\bar{X} - \mu)\) であるため、

\[ \sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \]

期待値を取ると、\(\mathbb{E}[(X_i - \mu)^2] = \sigma^2\) なので、

\[ \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = n\sigma^2 - \mathbb{E}[n(\bar{X} - \mu)^2] \]

標本平均の分散は \(\text{V}(\bar{X}) = \frac{\sigma^2}{n}\) なので、

\[ \mathbb{E}[(\bar{X} - \mu)^2] = \text{V}(\bar{X})=\frac{\sigma^2}{n} \]

これを用いると、

\[ \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = n\sigma^2 - n \cdot \frac{\sigma^2}{n} = (n-1)\sigma^2 \]

したがって、不偏分散 \(\hat{\sigma}^2\) の期待値は、

\[ \mathbb{E}[\hat{\sigma}^2] = \frac{1}{n-1} \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = \frac{1}{n-1} \cdot (n-1)\sigma^2 = \sigma^2 \]

これにより、不偏分散は母分散の不偏推定量であることが示されました。

4. 例題

ふゅか
ふゅか
じゃあ、具体的に例を使って説明してみるね。例えば、プロジェクトの収益を考えるよ。
はるか
はるか
うん、収益データを使う。A: 150, B: 200, C: 250, D: 300, E: 350。

4.1. 例題1:プロジェクトの収益

ある会社が以下の5つのプロジェクトからの収益を記録しました。それぞれの収益は次の通りです(単位は万円)。

  • プロジェクトA: 150
  • プロジェクトB: 200
  • プロジェクトC: 250
  • プロジェクトD: 300
  • プロジェクトE: 350

この5つのプロジェクトから得られた収益の不偏分散を計算してください。

収益のデータをすべて足して平均を求めます。

平均 \(\bar{x}\) は次の式で計算されます。

\[ \bar{x} = \frac{150 + 200 + 250 + 300 + 350}{5} = \frac{1250}{5} = 250 \]

各プロジェクトの収益から平均を引いて偏差を計算します。

  • プロジェクトA: \(150 - 250 = -100\)
  • プロジェクトB: \(200 - 250 = -50\)
  • プロジェクトC: \(250 - 250 = 0\)
  • プロジェクトD: \(300 - 250 = 50\)
  • プロジェクトE: \(350 - 250 = 100\)

各偏差を二乗します。

  • プロジェクトA: \((-100)^2 = 10000\)
  • プロジェクトB: \((-50)^2 = 2500\)
  • プロジェクトC: \(0^2 = 0\)
  • プロジェクトD: \(50^2 = 2500\)
  • プロジェクトE: \(100^2 = 10000\)

二乗した偏差を合計します。

\[ 10000 + 2500 + 0 + 2500 + 10000 = 25000 \]

不偏分散は次の式で計算されます。

\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]

ここで、\(n = 5\) ですから、

\[ s^2 = \frac{25000}{5 - 1} = \frac{25000}{4} = 6250 \]

この会社のプロジェクト収益の不偏分散は $6250万円^2 $です。

4.2. 例題2:魔法の成功回数

ある魔法学校の生徒たちは、試験で以下の5種類の魔法を使用してみました。それぞれの魔法を成功させた回数(単位は回数)は次の通りです:

  • 魔法A(火の魔法): 10回
  • 魔法B(水の魔法): 15回
  • 魔法C(風の魔法): 20回
  • 魔法D(土の魔法): 25回
  • 魔法E(光の魔法): 30回

この5種類の魔法の成功回数の不偏分散を計算してください。

成功回数のデータをすべて足して平均を求めます。

平均 \(\bar{x}\) は次の式で計算されます。

\[ \bar{x} = \frac{10 + 15 + 20 + 25 + 30}{5} = \frac{100}{5} = 20 \]

各魔法の成功回数から平均を引いて偏差を計算します。

  • 魔法A: \(10 - 20 = -10\)
  • 魔法B: \(15 - 20 = -5\)
  • 魔法C: \(20 - 20 = 0\)
  • 魔法D: \(25 - 20 = 5\)
  • 魔法E: \(30 - 20 = 10\)

各偏差を二乗します。

  • 魔法A: \((-10)^2 = 100\)
  • 魔法B: \((-5)^2 = 25\)
  • 魔法C: \(0^2 = 0\)
  • 魔法D: \(5^2 = 25\)
  • 魔法E: \(10^2 = 100\)

二乗した偏差を合計します。

\[ 100 + 25 + 0 + 25 + 100 = 250 \]

不偏分散は次の式で計算されます。

\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]

ここで、\(n = 5\) ですから、

\[ s^2 = \frac{250}{5 - 1} = \frac{250}{4} = 62.5 \]

魔法の成功回数の不偏分散は$ 62.5回^2$ です。

PR