更新:2025/02/27

母平均の区間推定の考え方と意味、例題について

はるか
はるか
信頼区間って、どんな考え方?
ふゅか
ふゅか
簡単に言うと、「この範囲に母平均があるはず!」って推測する方法よ!例えば95%信頼区間なら、「95%の確率でこの範囲に母平均がある」と考えるの。

1. 母平均の区間推定の考え方

母平均の区間推定では、「母集団の平均 \(\mu\)」がどの範囲にあるかを、ある確率(信頼係数)で推定することを目的とします。以下では、母分散が「既知」か「未知」か、そして標本サイズが「大きい」か「小さい」かによって手法が異なるため、3つの場合に分けてまとめます。

1.1. 信頼区間とは

信頼区間とはある母集団の未知のパラメータ(例えば母平均 $\mu$)が、一定の確率(信頼係数)で含まれると推定される範囲のことです。

例えば、「95%信頼区間」が $[a, b]$なら、「母平均 $\mu$ は 95%の確率でこの範囲にある」と考えます。

2. 母分散が既知の場合

ふゅか
ふゅか
例えば、母分散と正規分布に従うことがわかっている場合は、標準正規分布を使うわね!
はるか
はるか
標準正規分布…つまり、Z値を使う?

2.1. 前提条件

  • 母集団が正規分布 \(\mathcal{N}(\mu, \sigma^2)\) に従う
  • 母分散 \(\sigma^2\) はあらかじめわかっている(既知)
  • 標本サイズは \(n\)

2.2. 標本平均の分布

母集団が正規分布に従い、母分散も既知の場合、標本平均 \(\bar{X}\) は \[ \bar{X} \sim \mathcal{N}\!\bigl(\mu, \tfrac{\sigma^2}{n}\bigr) \] と分布します。

2.3. 標準化

母平均 \(\mu\) を推定するためには、まず標本平均を以下のように標準化します。

\[ Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \]

のとき、\(Z\) は平均0、分散1の標準正規分布 \( \mathcal{N}(0,1) \) に従います。

2.4. 信頼区間の導出

有意水準$\alpha$の下で、標準正規分布表、または標準正規分布の特性から、確率が \(1-\alpha\) となる区間は \[ P\!\bigl(-z_{\alpha/2} \leq Z \leq z_{\alpha/2}\bigr) = 1 - \alpha \] と表されます。これを \(\mu\) について解くと、次の不等式が得られます。

\[ \bar{X} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \;\;\leq\;\; \mu \;\;\leq\;\; \bar{X} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \]

これによって、母平均 \(\mu\) の信頼区間が \[ \Bigl(\,\bar{X} - z_{\alpha/2}\tfrac{\sigma}{\sqrt{n}},\, \bar{X} + z_{\alpha/2}\tfrac{\sigma}{\sqrt{n}}\Bigr) \] と求められます。

2.5. 具体例:95%信頼区間

たとえば、信頼係数を95%(\(\alpha=0.05\))とする場合、標準正規分布表から \(z_{0.025} \approx 1.96\) がわかります。

よって、95%信頼区間は \[ \bar{X} \;\pm\; 1.96 \frac{\sigma}{\sqrt{n}} \] という形になります。

3. 母分散が未知で標本サイズが小さい場合

3.1. 前提条件

  • 母集団は正規分布 \(\mathcal{N}(\mu, \sigma^2)\) に従う
  • 母分散 \(\sigma^2\) は未知
  • 標本サイズ \(n\) は小さい(一般的に \(n<30\) 程度)

標本サイズが小さいときは、母集団が正規分布に従うことを仮定しても、母分散を推定しなければなりません。そうした場合、\(t\) 分布を用いた区間推定を行います。

3.2. 標本平均と不偏分散

まず、標本平均 \(\bar{X}\) と不偏分散 \(U^2\) を求めます。不偏分散 は次式で定義されます。 \[ U^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \bar{X})^2. \]

これは母分散 \(\sigma^2\) の不偏推定量であり、母分散がわからないときにはこれを用います。

3.3. \(t\) 分布による標準化変数

母分散の代わりに不偏分散から求めた標準偏差 \(U\) を使って、標本平均を標準化します。

\[ T = \frac{\bar{X} - \mu}{U/\sqrt{n}} \]

このとき、\(T\) は自由度 \(n-1\) の \(t\) 分布に従います。

3.4. 信頼区間の導出

\(t\) 分布を用いた場合も、標準正規分布と同様に \[ P\!\bigl(-t_{\alpha/2,\,n-1} \leq T \leq t_{\alpha/2,\,n-1}\bigr) = 1 - \alpha \] が成り立ちます。

これを \(\mu\) について解くと、 \[ \bar{X} - t_{\alpha/2, n-1}\frac{U}{\sqrt{n}} \;\;\leq\;\; \mu \;\;\leq\;\; \bar{X} + t_{\alpha/2, n-1}\frac{U}{\sqrt{n}} \] という区間が得られます。

よって母平均 \(\mu\) の信頼区間は \[ \Bigl(\,\bar{X} - t_{\alpha/2, n-1}\tfrac{U}{\sqrt{n}},\, \bar{X} + t_{\alpha/2, n-1}\tfrac{U}{\sqrt{n}}\Bigr) \] となります。

4. 母分散が未知で標本サイズが大きい場合

はるか
はるか
標本サイズが大きい場合は?
ふゅか
ふゅか
そのときは中心極限定理を使って、標本平均がほぼ正規分布に従うと考えるの!

4.1. 前提条件

  • 母集団の分布は正規分布でなくてもかまわない(中心極限定理が適用できる)
  • 母分散 \(\sigma^2\) は未知であるが、標本不偏分散 \(U^2\) から推定を行う
  • 標本サイズ \(n\) は大きい

標本サイズが十分大きい場合、中心極限定理によって標本平均の分布を正規分布で近似できます。母分散は不明ですが、不偏分散 \(U^2\) を利用して区間推定を行います。

4.2. 標本平均の近似

中心極限定理によると、標本サイズが大きいとき標本平均 \(\bar{X}\) は近似的に \[ \bar{X} \approx \mathcal{N}\!\bigl(\mu, \tfrac{\sigma^2}{n}\bigr) \] とみなすことができます。

4.3. 標準化

母分散が未知なので、不偏分散 \(U^2\) を使って標本平均を標準化します。

\[ Z = \frac{\bar{X} - \mu}{\,U/\sqrt{n}\,} \]

標本サイズが大きいとき、この \(Z\) は標準正規分布に従うと近似できます。

4.4. 信頼区間の導出

標準正規分布に従うと近似した場合、確率 \(1-\alpha\) で \[ P\!\bigl(-z_{\alpha/2} \leq Z \leq z_{\alpha/2}\bigr) = 1 - \alpha \] が成り立ちます。これを \(\mu\) について解くと、 \[ \bar{X} - z_{\alpha/2}\frac{U}{\sqrt{n}} \;\;\leq\;\; \mu \;\;\leq\;\; \bar{X} + z_{\alpha/2}\frac{U}{\sqrt{n}} \] となり、母平均 \(\mu\) の信頼区間が \[ \Bigl(\,\bar{X} - z_{\alpha/2}\tfrac{U}{\sqrt{n}},\; \bar{X} + z_{\alpha/2}\tfrac{U}{\sqrt{n}}\Bigr) \] で与えられます。

4.5. 具体例:95%信頼区間

\(\alpha = 0.05\) すなわち信頼係数が95%のとき、標準正規分布の臨界値は \(z_{0.025} \approx 1.96\) となるので、 \[ \bar{X} \;\pm\; 1.96 \frac{U}{\sqrt{n}} \] が95%信頼区間の目安となります。

5. 例題

5.1. 例題 1:母分散が既知の場合

ある製品の耐久時間(単位:時間)は、正規分布 \(\mathcal{N}(\mu, \sigma^2)\) に従うとします。過去のデータから、母標準偏差が \(\sigma = 10\) 時間であることが分かっています。この製品から 25個 の標本を取り、平均耐久時間を計測したところ、\(\bar{X} = 200\) 時間でした。

このとき、母平均 \(\mu\) の 95% 信頼区間 を求めなさい。

5.1.1. 条件の整理

  • 母分散が 既知:\(\sigma^2 = 10^2 = 100\)
  • 標本サイズ:\(n = 25\)
  • 標本平均:\(\bar{X} = 200\)
  • 信頼係数:\(95\%\)(\(\alpha = 0.05\))
  • 標準正規分布の 上側 2.5% 点:\(z_{0.025} \approx 1.96\)

5.1.2. 信頼区間の計算

母分散が既知の場合の信頼区間の式は \[ \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \]

ここに数値を代入すると、 \[ 200 \pm 1.96 \times \frac{10}{\sqrt{25}} \]

\[ 200 \pm 1.96 \times 2 \]

\[ 200 \pm 3.92 \]

\[ (196.08, 203.92) \]

5.1.3. 結論

母平均 \(\mu\) の 95% 信頼区間\((196.08, 203.92)\) です。

5.2. 例題 2:母分散が未知で標本サイズが小さい場合

ある新製品のバッテリー寿命(単位:時間)を調査するため、10個 の標本を取り、平均寿命 \(\bar{X} = 50\) 時間、標本の不偏分散 \(U^2 = 25\) 時間を得ました。

このとき、母平均 \(\mu\) の 95% 信頼区間 を求めなさい。

5.2.1. 条件の整理

  • 母分散 未知
  • 標本サイズ:\(n = 10\)(小標本)
  • 標本平均:\(\bar{X} = 50\)
  • 不偏分散:\(U^2 = 25\)
  • 信頼係数 95%(\(\alpha = 0.05\))
  • 自由度 \(n-1 = 9\) の \(t_{0.025, 9}\) を調べる
    • \(t_{0.025, 9} \approx 2.262\)(t分布表より

5.2.2. 信頼区間の計算

母分散が未知で小標本の場合、信頼区間の式は \[ \bar{X} \pm t_{\alpha/2, n-1} \frac{U}{\sqrt{n}} \]

これに数値を代入すると、

\[ \begin{align*} 50 \pm 2.262 \times \frac{5}{\sqrt{10}} &= 50 \pm 2.262 \times 1.581 \\ &= 50 \pm 3.58 \\ &= (46.42, 53.58) \end{align*} \]

5.2.3. 結論

母平均 \(\mu\) の 95% 信頼区間\((46.42, 53.58)\) です。

5.3. 例題 3:母分散が未知で標本サイズが大きい場合

ある工場の生産ラインの製品重量(単位:kg)を調査するため、50個 の標本を測定したところ、標本平均 \(\bar{X} = 500\) kg、標本の不偏分散 \(U^2 = 20^2\) kg でした。

このとき、母平均 \(\mu\) の 95% 信頼区間 を求めなさい。

5.3.1. 条件の整理

  • 母分散 未知
  • 標本サイズ 大きい(\(n = 50\))
  • 標本平均:\(\bar{X} = 500\)
  • 不偏分散:\(U^2 = 20^2\)
  • 信頼係数 95%(\(\alpha = 0.05\))
  • 標本サイズが 大きい ので、標準正規分布を使用し \(z_{0.025} \approx 1.96\)

5.3.2. 信頼区間の計算

母分散が未知で標本サイズが大きい場合の信頼区間は \[ \bar{X} \pm z_{\alpha/2} \frac{U}{\sqrt{n}} \]

数値を代入すると、

\[ \begin{align*} 500 \pm 1.96 \times \frac{20}{\sqrt{50}} &= 500 \pm 1.96 \times 2.828 \\ &= 500 \pm 5.54 \\ &= (494.46, 505.54) \end{align*} \]

5.3.3. 結論

母平均 \(\mu\) の 95% 信頼区間\((494.46, 505.54)\) です。

6. まとめ

以上を整理すると、母平均の区間推定では、次のように母分散の既知・未知と標本サイズの大小によって手法が変わります。

条件 使用する分布 標準化変数 信頼区間
母分散が既知 \(\mathcal{N}(\mu, \sigma^2)\) \(Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}\) \(\bar{X} \pm z_{\alpha/2} \tfrac{\sigma}{\sqrt{n}}\)
母分散が未知・標本サイズが小さい 自由度 \(n-1\) の \(t\) 分布 \(T = \frac{\bar{X} - \mu}{U / \sqrt{n}}\) \(\bar{X} \pm t_{\alpha/2,\,n-1} \tfrac{U}{\sqrt{n}}\)
母分散が未知・標本サイズが大きい 中心極限定理で近似的に正規分布とみなせる \(Z = \frac{\bar{X} - \mu}{U / \sqrt{n}}\) \(\bar{X} \pm z_{\alpha/2} \tfrac{U}{\sqrt{n}}\)

 

PR