更新:2024/12/04

標本平均の期待値・分散・不偏推定量・性質・練習問題について

ふゅか
ふゅか
標本平均って何だと思う?
はるか
はるか
集団からのデータの平均。母平均を推定するために使う。
ふゅか
ふゅか
そう!標本平均は、母集団の平均を推定するための大事な指標なのよ!

1. 標本平均とは

標本平均とは、ある集団(母集団)から抽出したデータの平均値を指します。標本平均は、母集団全体の平均(母平均)を推定するために用いられる重要な指標です。

標本平均 \(\bar{x}\) は、次の式で表されます。

\[ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \]

ここで、

  • \(n\) は標本のサイズ(データの個数)
  • \(x_i\) は各標本データの値
はるか
はるか
例えば5つのデータがあったら、合計して個数で割れば標本平均が出る。
ふゅか
ふゅか
その通り!全てのデータの合計をデータの個数で割るだけで計算できるわ♪

1.1. 標本平均の計算方法

例えば、5つのデータ \(x_1 = 4\)、\(x_2 = 8\)、\(x_3 = 6\)、\(x_4 = 10\)、\(x_5 = 2\) がある場合、標本平均は次のように計算されます。

\[ \bar{x} = \frac{4 + 8 + 6 + 10 + 2}{5} = \frac{30}{5} = 6 \]

この場合、標本平均は 6 となります。

2. 標本平均の性質

2.1. 母平均の不偏推定量

標本平均\(\bar{X}\) は母平均の不偏推定量である。標本平均の期待値は次のように表すことができる。$$E[\bar{X}]=\mu$$

ふゅか
ふゅか
標本平均ってどうして母平均の不偏推定量になるのか知ってる?
はるか
はるか
期待値が母平均に等しいから。不偏推定量になる理由。

母集団の平均を \(\mu\)、母集団の分散を \(\sigma^2\) とします。また、母集団から \(n\) 個のサンプル \(X_1, X_2, \dots, X_n\) を抽出したとします。これらのサンプルの標本平均を、\(\bar{X}\) で表します。

\[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]

この標本平均 \(\bar{X}\) が母平均 \(\mu\) の不偏推定量であることを示すためには、\(\bar{X}\) の期待値が \(\mu\) に等しいことを証明する必要があります。

\[ E[\bar{X}] = E\left[\frac{1}{n} \sum_{i=1}^n X_i\right] \]

期待値の線形性を利用すると、

\[ E[\bar{X}] = \frac{1}{n} \sum_{i=1}^n E[X_i] \]

となります。ここで、各 \(X_i\) の期待値は母平均 \(\mu\) に等しいので、

\[ E[\bar{X}] = \frac{1}{n} \sum_{i=1}^n \mu = \frac{n\mu}{n} = \mu \]

したがって、標本平均 \(\bar{X}\) の期待値は母平均 \(\mu\) に等しいことがわかります。これにより、標本平均 \(\bar{X}\) は母平均 \(\mu\) の不偏推定量であることがわかる。

2.2. 標本平均の分散

母集団の分散を \(\sigma^2\)、標本サイズを \(n\)、標本平均を \(\bar{X}\) とすると、標本平均の分散 \( V(\bar{X}) \) は次のようになります。 \[ V(\bar{X}) = \frac{\sigma^2}{n} \]

母集団からランダムに抽出された各標本 \(X_i\) の分散は、母集団の分散 \(\sigma^2\) に等しいです。 \[ V(X_i) = \sigma^2 \]

標本平均 \(\bar{X}\) は次のように定義されます。 \[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]

分散の性質を用いて、標本平均 \(\bar{X}\) の分散を計算します。

\[ V(\bar{X}) = V\left(\frac{1}{n} \sum_{i=1}^n X_i \right) \]

\[ V\left(\frac{1}{n} \sum_{i=1}^n X_i \right) = \frac{1}{n^2} V\left(\sum_{i=1}^n X_i \right) \]

また、互いに独立な標本 \(X_i\) の分散の和は、それぞれの分散の和に等しいため、

\[ V\left(\sum_{i=1}^n X_i \right) = \sum_{i=1}^n V(X_i) = n\sigma^2 \]

標本平均の分散は次のようになります。

\[ V(\bar{X}) = \frac{1}{n^2} \times n\sigma^2 = \frac{\sigma^2}{n} \]

2.3. 標本平均と漸化式

$X_n= \displaystyle\frac{1}{n} \sum_{i=1}^{n} x_i$とします。標本平均は次のような漸化式で表されます。

$$X_n = X_{n-1}+\frac{1}{n}(x_n-X_{n-1})$$

式変形をして漸化式を求めます。

$$X_n= \frac{1}{n} \sum_{i=1}^{n} x_i$$

$$=\frac{1}{n}(x_1+x_2+\dots + x_n)$$

$$=\frac{1}{n}(x_1+x_2+\dots + x_{n-1})+\frac{1}{n}x_n$$

$$=\frac{n-1}{n}\frac{(x_1+x_2+\dots + x_{n-1})}{n-1}+\frac{1}{n}x_n$$

$$=\frac{n-1}{n}X_{n-1}+\frac{1}{n}x_n$$

$$\therefore X_n = X_{n-1}+\frac{1}{n}(x_n-X_{n-1})$$

このため、新しくデータが増えた場合に、標本平均を更新する場合、先ほどの式を用いれば計算することができます。

ふゅか
ふゅか
漸化式も面白いよね。新しいデータが増えたとき、標本平均を更新に使えるんだ。

3. 練習問題

3.1. 例題1: 標本平均の計算

ある工場で製造された電池の寿命(単位:時間)を調査するために、ランダムに10個の電池を選んでその寿命を測定しました。以下のデータは、各電池の寿命を示しています。

\[ \begin{array}{c|c|c|c|c|c|c|c|c|c} 400 & 420 & 415 & 430 & 405 & 410 & 425 & 395 & 435 & 410 \\ \end{array} \]

標本平均 \(\bar{x}\) は、標本データの和を標本サイズ \(n\) で割ることで求められます。まず、データの和を計算します。

\[ 400 + 420 + 415 + 430 + 405 + 410 + 425 + 395 + 435 + 410 = 4145 \]

次に、この和を標本サイズ \(n = 10\) で割ります。

\[ \bar{x} = \frac{4145}{10} = 414.5 \]

したがって、標本平均は 414.5時間 となります。

3.2. 例題2: 新しいサンプルが追加されたときの標本平均

ある製品の寿命(単位:時間)について、9個のサンプルから得られたデータに基づいて標本平均が  450 時間であることがわかっています。このとき、さらに1個の新しいサンプルを測定し、その寿命が 470 時間であることが判明しました。

サンプルが追加されたときの標本平均 を求めなさい。

ふゅか
ふゅか
漸化式を使って計算してみよう!

漸化式を使用して、新しい標本平均 \( X_{10} \) を計算します。

\[ X_n = X_{n-1} + \frac{1}{n}(x_n - X_{n-1}) \]

ここで、\( n = 10 \)、\( X_9 = 450 \)、そして新しいサンプル \( x_{10} = 470 \) です。この情報を式に代入して計算します。

\[ X_{10} = X_9 + \frac{1}{10}(x_{10} - X_9) \]

数値を代入すると、

\[ X_{10} = 450 + \frac{1}{10}(470 - 450) \]

\[ X_{10} = 450 + \frac{1}{10} \times 20 \]

\[ X_{10} = 450 + 2 = 452 \]

したがって、新しい標本平均は 452時間 となります。

はるか
はるか
漸化式を使わないで計算も試してみる。

まず、既存の標本(9個)の総和を求めます。標本平均が \( \bar{x}_9 = 450 \) 時間であるため、総和 \( S_9 \) は次のように計算できます。

\[ S_9 = \bar{x}_9 \times 9 = 450 \times 9 = 4050 \]

次に、新しいサンプルを追加した後の総和 \( S_{10} \) を求めます。

\[ S_{10} = S_9 + 470 = 4050 + 470 = 4520 \]

新しい標本平均 \( \bar{x}_{10} \) は、総和 \( S_{10} \) を新しい標本サイズ \( n = 10 \) で割ることで求められます。

\[ \bar{x}_{10} = \frac{4520}{10} = 452 \]

したがって、新しい標本平均は 452時間 となります。

PR