分散期待値

更新:2024/12/04

標本平均の期待値・分散・不偏推定量・性質・練習問題について

$ふゅか$

ふゅか

標本平均って何だと思う？

$はるか$

はるか

集団からのデータの平均。母平均を推定するために使う。

$ふゅか$

ふゅか

そう！標本平均は、母集団の平均を推定するための大事な指標なのよ！

1. 標本平均とは
1.1. 標本平均の計算方法
2. 標本平均の性質
2.1. 母平均の不偏推定量
2.2. 標本平均の分散
2.3. 標本平均と漸化式
3. 練習問題
3.1. 例題1: 標本平均の計算
3.2. 例題2: 新しいサンプルが追加されたときの標本平均

1. 標本平均とは

標本平均とは、ある集団（母集団）から抽出したデータの平均値を指します。標本平均は、母集団全体の平均（母平均）を推定するために用いられる重要な指標です。

標本平均 $\bar{x}$ は、次の式で表されます。

\[ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i \]

ここで、

$n$ は標本のサイズ（データの個数）
$x_i$ は各標本データの値

$はるか$

はるか

例えば5つのデータがあったら、合計して個数で割れば標本平均が出る。

$ふゅか$

ふゅか

その通り！全てのデータの合計をデータの個数で割るだけで計算できるわ♪

1.1. 標本平均の計算方法

例えば、5つのデータ $x_1 = 4$、$x_2 = 8$、$x_3 = 6$、$x_4 = 10$、$x_5 = 2$ がある場合、標本平均は次のように計算されます。

\[ \bar{x} = \frac{4 + 8 + 6 + 10 + 2}{5} = \frac{30}{5} = 6 \]

この場合、標本平均は 6 となります。

2. 標本平均の性質

2.1. 母平均の不偏推定量

標本平均$\bar{X}$ は母平均の不偏推定量である。標本平均の期待値は次のように表すことができる。$$E[\bar{X}]=\mu$$

$ふゅか$

ふゅか

標本平均ってどうして母平均の不偏推定量になるのか知ってる？

$はるか$

はるか

期待値が母平均に等しいから。不偏推定量になる理由。

母集団の平均を $\mu$、母集団の分散を $\sigma^2$ とします。また、母集団から $n$ 個のサンプル $X_1, X_2, \dots, X_n$ を抽出したとします。これらのサンプルの標本平均を、$\bar{X}$ で表します。

\[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]

この標本平均 $\bar{X}$ が母平均 $\mu$ の不偏推定量であることを示すためには、$\bar{X}$ の期待値が $\mu$ に等しいことを証明する必要があります。

\[ E[\bar{X}] = E\left[\frac{1}{n} \sum_{i=1}^n X_i\right] \]

期待値の線形性を利用すると、

\[ E[\bar{X}] = \frac{1}{n} \sum_{i=1}^n E[X_i] \]

となります。ここで、各 $X_i$ の期待値は母平均 $\mu$ に等しいので、

\[ E[\bar{X}] = \frac{1}{n} \sum_{i=1}^n \mu = \frac{n\mu}{n} = \mu \]

したがって、標本平均 $\bar{X}$ の期待値は母平均 $\mu$ に等しいことがわかります。これにより、標本平均 $\bar{X}$ は母平均 $\mu$ の不偏推定量であることがわかる。

2.2. 標本平均の分散

母集団の分散を $\sigma^2$、標本サイズを $n$、標本平均を $\bar{X}$ とすると、標本平均の分散 $ V(\bar{X}) $ は次のようになります。 \[ V(\bar{X}) = \frac{\sigma^2}{n} \]

母集団からランダムに抽出された各標本 $X_i$ の分散は、母集団の分散 $\sigma^2$ に等しいです。 \[ V(X_i) = \sigma^2 \]

標本平均 $\bar{X}$ は次のように定義されます。 \[ \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \]

分散の性質を用いて、標本平均 $\bar{X}$ の分散を計算します。

\[ V(\bar{X}) = V\left(\frac{1}{n} \sum_{i=1}^n X_i \right) \]

\[ V\left(\frac{1}{n} \sum_{i=1}^n X_i \right) = \frac{1}{n^2} V\left(\sum_{i=1}^n X_i \right) \]

また、互いに独立な標本 $X_i$ の分散の和は、それぞれの分散の和に等しいため、

\[ V\left(\sum_{i=1}^n X_i \right) = \sum_{i=1}^n V(X_i) = n\sigma^2 \]

標本平均の分散は次のようになります。

\[ V(\bar{X}) = \frac{1}{n^2} \times n\sigma^2 = \frac{\sigma^2}{n} \]

2.3. 標本平均と漸化式

$X_n= \displaystyle\frac{1}{n} \sum_{i=1}^{n} x_i$とします。標本平均は次のような漸化式で表されます。

$$X_n = X_{n-1}+\frac{1}{n}(x_n-X_{n-1})$$

式変形をして漸化式を求めます。

$$X_n= \frac{1}{n} \sum_{i=1}^{n} x_i$$

$$=\frac{1}{n}(x_1+x_2+\dots + x_n)$$

$$=\frac{1}{n}(x_1+x_2+\dots + x_{n-1})+\frac{1}{n}x_n$$

$$=\frac{n-1}{n}\frac{(x_1+x_2+\dots + x_{n-1})}{n-1}+\frac{1}{n}x_n$$

$$=\frac{n-1}{n}X_{n-1}+\frac{1}{n}x_n$$

$$\therefore X_n = X_{n-1}+\frac{1}{n}(x_n-X_{n-1})$$

このため、新しくデータが増えた場合に、標本平均を更新する場合、先ほどの式を用いれば計算することができます。

$ふゅか$

ふゅか

漸化式も面白いよね。新しいデータが増えたとき、標本平均を更新に使えるんだ。

3. 練習問題

3.1. 例題1: 標本平均の計算

ある工場で製造された電池の寿命（単位：時間）を調査するために、ランダムに10個の電池を選んでその寿命を測定しました。以下のデータは、各電池の寿命を示しています。

\[ \begin{array}{c|c|c|c|c|c|c|c|c|c} 400 & 420 & 415 & 430 & 405 & 410 & 425 & 395 & 435 & 410 \\ \end{array} \]

標本平均 $\bar{x}$ は、標本データの和を標本サイズ $n$ で割ることで求められます。まず、データの和を計算します。

\[ 400 + 420 + 415 + 430 + 405 + 410 + 425 + 395 + 435 + 410 = 4145 \]

次に、この和を標本サイズ $n = 10$ で割ります。

\[ \bar{x} = \frac{4145}{10} = 414.5 \]

したがって、標本平均は 414.5時間となります。

3.2. 例題2: 新しいサンプルが追加されたときの標本平均

ある製品の寿命（単位：時間）について、9個のサンプルから得られたデータに基づいて標本平均が 450 時間であることがわかっています。このとき、さらに1個の新しいサンプルを測定し、その寿命が 470 時間であることが判明しました。

サンプルが追加されたときの標本平均を求めなさい。

$ふゅか$

ふゅか

漸化式を使って計算してみよう！

漸化式を使用して、新しい標本平均 $ X_{10} $ を計算します。

\[ X_n = X_{n-1} + \frac{1}{n}(x_n – X_{n-1}) \]

ここで、$ n = 10 $、$ X_9 = 450 $、そして新しいサンプル $ x_{10} = 470 $ です。この情報を式に代入して計算します。

\[ X_{10} = X_9 + \frac{1}{10}(x_{10} – X_9) \]

数値を代入すると、

\[ X_{10} = 450 + \frac{1}{10}(470 – 450) \]

\[ X_{10} = 450 + \frac{1}{10} \times 20 \]

\[ X_{10} = 450 + 2 = 452 \]

したがって、新しい標本平均は 452時間となります。

$はるか$

はるか

漸化式を使わないで計算も試してみる。

まず、既存の標本（9個）の総和を求めます。標本平均が $ \bar{x}_9 = 450 $ 時間であるため、総和 $ S_9 $ は次のように計算できます。

\[ S_9 = \bar{x}_9 \times 9 = 450 \times 9 = 4050 \]

次に、新しいサンプルを追加した後の総和 $ S_{10} $ を求めます。

\[ S_{10} = S_9 + 470 = 4050 + 470 = 4520 \]

新しい標本平均 $ \bar{x}_{10} $ は、総和 $ S_{10} $ を新しい標本サイズ $ n = 10 $ で割ることで求められます。

\[ \bar{x}_{10} = \frac{4520}{10} = 452 \]

したがって、新しい標本平均は 452時間となります。

ホームに戻る

標本平均の期待値・分散・不偏推定量・性質・練習問題について

1. 標本平均とは

1.1. 標本平均の計算方法

2. 標本平均の性質

2.1. 母平均の不偏推定量

2.2. 標本平均の分散

2.3. 標本平均と漸化式

3. 練習問題

3.1. 例題1: 標本平均の計算

3.2. 例題2: 新しいサンプルが追加されたときの標本平均

標本分散と不偏分散の定義・不偏推定量・例題について

分布関数の意味と性質、例題について

確率の独立の意味と具体例について

様々なプログラミング言語による最小二乗法の導出（Python、Java、C、GO、Javascript、R、Haskell、Java）

【入門】マルコフ連鎖とマルコフ性・遷移行列・定常分布について