標本平均の期待値・分散・不偏推定量・性質・練習問題について




1. 標本平均とは
標本平均とは、ある集団(母集団)から抽出したデータの平均値を指します。標本平均は、母集団全体の平均(母平均)を推定するために用いられる重要な指標です。
\[ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \]
ここで、
- \(n\) は標本のサイズ(データの個数)
- \(x_i\) は各標本データの値


1.1. 標本平均の計算方法
例えば、5つのデータ \(x_1 = 4\)、\(x_2 = 8\)、\(x_3 = 6\)、\(x_4 = 10\)、\(x_5 = 2\) がある場合、標本平均は次のように計算されます。
\[ \bar{x} = \frac{4 + 8 + 6 + 10 + 2}{5} = \frac{30}{5} = 6 \]
この場合、標本平均は 6 となります。
2. 標本平均の性質
2.1. 母平均の不偏推定量


母集団の平均を \(\mu\)、母集団の分散を \(\sigma^2\) とします。また、母集団から \(n\) 個のサンプル \(X_1, X_2, \dots, X_n\) を抽出したとします。これらのサンプルの標本平均を、\(\bar{X}\) で表します。
\[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]
この標本平均 \(\bar{X}\) が母平均 \(\mu\) の不偏推定量であることを示すためには、\(\bar{X}\) の期待値が \(\mu\) に等しいことを証明する必要があります。
\[ E[\bar{X}] = E\left[\frac{1}{n} \sum_{i=1}^n X_i\right] \]
期待値の線形性を利用すると、
\[ E[\bar{X}] = \frac{1}{n} \sum_{i=1}^n E[X_i] \]
となります。ここで、各 \(X_i\) の期待値は母平均 \(\mu\) に等しいので、
\[ E[\bar{X}] = \frac{1}{n} \sum_{i=1}^n \mu = \frac{n\mu}{n} = \mu \]
したがって、標本平均 \(\bar{X}\) の期待値は母平均 \(\mu\) に等しいことがわかります。これにより、標本平均 \(\bar{X}\) は母平均 \(\mu\) の不偏推定量であることがわかる。
2.2. 標本平均の分散
母集団からランダムに抽出された各標本 \(X_i\) の分散は、母集団の分散 \(\sigma^2\) に等しいです。 \[ V(X_i) = \sigma^2 \]
標本平均 \(\bar{X}\) は次のように定義されます。 \[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]
分散の性質を用いて、標本平均 \(\bar{X}\) の分散を計算します。
\[ V(\bar{X}) = V\left(\frac{1}{n} \sum_{i=1}^n X_i \right) \]
\[ V\left(\frac{1}{n} \sum_{i=1}^n X_i \right) = \frac{1}{n^2} V\left(\sum_{i=1}^n X_i \right) \]
また、互いに独立な標本 \(X_i\) の分散の和は、それぞれの分散の和に等しいため、
\[ V\left(\sum_{i=1}^n X_i \right) = \sum_{i=1}^n V(X_i) = n\sigma^2 \]
標本平均の分散は次のようになります。
\[ V(\bar{X}) = \frac{1}{n^2} \times n\sigma^2 = \frac{\sigma^2}{n} \]
2.3. 標本平均と漸化式
$$X_n = X_{n-1}+\frac{1}{n}(x_n-X_{n-1})$$
式変形をして漸化式を求めます。
$$X_n= \frac{1}{n} \sum_{i=1}^{n} x_i$$
$$=\frac{1}{n}(x_1+x_2+\dots + x_n)$$
$$=\frac{1}{n}(x_1+x_2+\dots + x_{n-1})+\frac{1}{n}x_n$$
$$=\frac{n-1}{n}\frac{(x_1+x_2+\dots + x_{n-1})}{n-1}+\frac{1}{n}x_n$$
$$=\frac{n-1}{n}X_{n-1}+\frac{1}{n}x_n$$
$$\therefore X_n = X_{n-1}+\frac{1}{n}(x_n-X_{n-1})$$
このため、新しくデータが増えた場合に、標本平均を更新する場合、先ほどの式を用いれば計算することができます。

3. 練習問題
3.1. 例題1: 標本平均の計算
\[ \begin{array}{c|c|c|c|c|c|c|c|c|c} 400 & 420 & 415 & 430 & 405 & 410 & 425 & 395 & 435 & 410 \\ \end{array} \]
標本平均 \(\bar{x}\) は、標本データの和を標本サイズ \(n\) で割ることで求められます。まず、データの和を計算します。
\[ 400 + 420 + 415 + 430 + 405 + 410 + 425 + 395 + 435 + 410 = 4145 \]
次に、この和を標本サイズ \(n = 10\) で割ります。
\[ \bar{x} = \frac{4145}{10} = 414.5 \]
したがって、標本平均は 414.5時間 となります。
3.2. 例題2: 新しいサンプルが追加されたときの標本平均
サンプルが追加されたときの標本平均 を求めなさい。

漸化式を使用して、新しい標本平均 \( X_{10} \) を計算します。
\[ X_n = X_{n-1} + \frac{1}{n}(x_n - X_{n-1}) \]
ここで、\( n = 10 \)、\( X_9 = 450 \)、そして新しいサンプル \( x_{10} = 470 \) です。この情報を式に代入して計算します。
\[ X_{10} = X_9 + \frac{1}{10}(x_{10} - X_9) \]
数値を代入すると、
\[ X_{10} = 450 + \frac{1}{10}(470 - 450) \]
\[ X_{10} = 450 + \frac{1}{10} \times 20 \]
\[ X_{10} = 450 + 2 = 452 \]
したがって、新しい標本平均は 452時間 となります。

まず、既存の標本(9個)の総和を求めます。標本平均が \( \bar{x}_9 = 450 \) 時間であるため、総和 \( S_9 \) は次のように計算できます。
\[ S_9 = \bar{x}_9 \times 9 = 450 \times 9 = 4050 \]
次に、新しいサンプルを追加した後の総和 \( S_{10} \) を求めます。
\[ S_{10} = S_9 + 470 = 4050 + 470 = 4520 \]
新しい標本平均 \( \bar{x}_{10} \) は、総和 \( S_{10} \) を新しい標本サイズ \( n = 10 \) で割ることで求められます。
\[ \bar{x}_{10} = \frac{4520}{10} = 452 \]
したがって、新しい標本平均は 452時間 となります。