標本分散と不偏分散の定義・不偏推定量・例題について



1. 標本分散とは
\[ S^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]
標本分散は母分散の不偏推定量ではないです。
- \(n\) はサンプルの大きさ(データの個数)
- \(x_i\) は各データの値
- \(\bar{x}\) はサンプルの平均(標本平均)
2. 不偏分散とは
不偏分散は、サンプルデータから母集団の分散を推定するときに使用されます。
\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]
- \(n\) はサンプルの大きさ(データの個数)
- \(x_i\) は各データの値
- \(\bar{x}\) はサンプルの平均(標本平均)
3. 不偏分散の性質
3.1. 母分散の不偏推定量
$$\mathbb{E}[\hat{\sigma}^2 ] = \sigma^2$$
まず、母分散 \(\sigma^2\) は以下の式で定義されます。
\[ \sigma^2 = \mathbb{E}\left[(X - \mu)^2\right] \]
ここで、\(\mu = \mathbb{E}[X]\) は母平均、\(\mathbb{E}\) は期待値を表しています。
標本分散は次の式で定義されます。
\[ S^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2 \]
ここで、\(\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i\) は標本平均、\(X_i\) は観測値、\(n\) は標本数(サンプル数)です。
不偏分散は次の式で定義されます。
\[ \hat{\sigma}^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2 \]
不偏分散が母分散の不偏推定量であるとは、期待値 \(\mathbb{E}[\hat{\sigma}^2] = \sigma^2\) であることを示すことです。
まず、標本平均 \(\bar{X}\) の性質を考えます。
\[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]
標本平均 \(\bar{X}\) の期待値は母平均に等しいことが知られています。
\[ \mathbb{E}[\bar{X}] = \mu \]
次に、\(\sum_{i=1}^n (X_i - \bar{X})^2\) の期待値を計算します。このために、標本分散の式を展開します。
\[ \sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n \left( (X_i - \mu) - (\bar{X} - \mu) \right)^2 \]
これを展開すると、次の3つの項に分けられます。
\[ = \sum_{i=1}^n (X_i - \mu)^2 - 2(\bar{X} - \mu)\sum_{i=1}^n (X_i - \mu) + n(\bar{X} - \mu)^2 \]
ここで、\(\sum_{i=1}^n (X_i - \mu) = n(\bar{X} - \mu)\) であるため、
\[ \sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \]
期待値を取ると、\(\mathbb{E}[(X_i - \mu)^2] = \sigma^2\) なので、
\[ \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = n\sigma^2 - \mathbb{E}[n(\bar{X} - \mu)^2] \]
標本平均の分散は \(\text{V}(\bar{X}) = \frac{\sigma^2}{n}\) なので、
\[ \mathbb{E}[(\bar{X} - \mu)^2] = \text{V}(\bar{X})=\frac{\sigma^2}{n} \]
これを用いると、
\[ \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = n\sigma^2 - n \cdot \frac{\sigma^2}{n} = (n-1)\sigma^2 \]
したがって、不偏分散 \(\hat{\sigma}^2\) の期待値は、
\[ \mathbb{E}[\hat{\sigma}^2] = \frac{1}{n-1} \mathbb{E}\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = \frac{1}{n-1} \cdot (n-1)\sigma^2 = \sigma^2 \]
これにより、不偏分散は母分散の不偏推定量であることが示されました。
4. 例題


4.1. 例題1:プロジェクトの収益
- プロジェクトA: 150
- プロジェクトB: 200
- プロジェクトC: 250
- プロジェクトD: 300
- プロジェクトE: 350
この5つのプロジェクトから得られた収益の不偏分散を計算してください。
収益のデータをすべて足して平均を求めます。
平均 \(\bar{x}\) は次の式で計算されます。
\[ \bar{x} = \frac{150 + 200 + 250 + 300 + 350}{5} = \frac{1250}{5} = 250 \]
各プロジェクトの収益から平均を引いて偏差を計算します。
- プロジェクトA: \(150 - 250 = -100\)
- プロジェクトB: \(200 - 250 = -50\)
- プロジェクトC: \(250 - 250 = 0\)
- プロジェクトD: \(300 - 250 = 50\)
- プロジェクトE: \(350 - 250 = 100\)
各偏差を二乗します。
- プロジェクトA: \((-100)^2 = 10000\)
- プロジェクトB: \((-50)^2 = 2500\)
- プロジェクトC: \(0^2 = 0\)
- プロジェクトD: \(50^2 = 2500\)
- プロジェクトE: \(100^2 = 10000\)
二乗した偏差を合計します。
\[ 10000 + 2500 + 0 + 2500 + 10000 = 25000 \]
不偏分散は次の式で計算されます。
\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]
ここで、\(n = 5\) ですから、
\[ s^2 = \frac{25000}{5 - 1} = \frac{25000}{4} = 6250 \]
この会社のプロジェクト収益の不偏分散は $6250万円^2 $です。
4.2. 例題2:魔法の成功回数
- 魔法A(火の魔法): 10回
- 魔法B(水の魔法): 15回
- 魔法C(風の魔法): 20回
- 魔法D(土の魔法): 25回
- 魔法E(光の魔法): 30回
この5種類の魔法の成功回数の不偏分散を計算してください。
成功回数のデータをすべて足して平均を求めます。
平均 \(\bar{x}\) は次の式で計算されます。
\[ \bar{x} = \frac{10 + 15 + 20 + 25 + 30}{5} = \frac{100}{5} = 20 \]
各魔法の成功回数から平均を引いて偏差を計算します。
- 魔法A: \(10 - 20 = -10\)
- 魔法B: \(15 - 20 = -5\)
- 魔法C: \(20 - 20 = 0\)
- 魔法D: \(25 - 20 = 5\)
- 魔法E: \(30 - 20 = 10\)
各偏差を二乗します。
- 魔法A: \((-10)^2 = 100\)
- 魔法B: \((-5)^2 = 25\)
- 魔法C: \(0^2 = 0\)
- 魔法D: \(5^2 = 25\)
- 魔法E: \(10^2 = 100\)
二乗した偏差を合計します。
\[ 100 + 25 + 0 + 25 + 100 = 250 \]
不偏分散は次の式で計算されます。
\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]
ここで、\(n = 5\) ですから、
\[ s^2 = \frac{250}{5 - 1} = \frac{250}{4} = 62.5 \]
魔法の成功回数の不偏分散は$ 62.5回^2$ です。