正規分布と再生性の意味と性質について




1. 正規分布の再生性とは?
正規分布(Gaussian distribution)は、統計学や確率論で最もよく使われる分布の1つです。その特徴の1つに「再生性」という性質があります。
1.1. 正規分布の基本的な性質
ここで:
- \(\mu\) は平均(期待値)
- \(\sigma^2\) は分散(データのばらつきの指標)
正規分布はグラフが釣鐘型で対称的な形をしており、平均値を中心に広がっています。

2. 再生性の定義
正規分布の再生性とは、正規分布に従う2つ以上の独立な確率変数を足し合わせると、その合計も正規分布に従うという性質を指します。
確率変数 \(X_1\) と \(X_2\) が以下のような正規分布に従うとします
\[ X_1 \sim N(\mu_1, \sigma_1^2), \quad X_2 \sim N(\mu_2, \sigma_2^2) \] また、これらの確率変数は互いに独立であるとします。
\(X = X_1 + X_2\) を新たな確率変数とすると、\(X\) も正規分布に従います。$X$の平均と分散は
- 平均(期待値): \(\mu = \mu_1 + \mu_2\)
- 分散: \(\sigma^2 = \sigma_1^2 + \sigma_2^2\)
つまり
\[ X \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) \]



2.1. 証明
\(X\) と \(Y\) が独立であるため,その和 \(X + Y\) の特性関数 \(\phi_{X+Y}(t)\) は, \[ \phi_{X+Y}(t) = E\bigl[e^{\,i t (X + Y)}\bigr] = E\bigl[e^{\,i t X}\bigr] \, E\bigl[e^{\,i t Y}\bigr] = \phi_X(t)\,\phi_Y(t) \] と書けます.
ここで,それぞれの特性関数は \[ \phi_X(t) = \exp\!\Bigl(i \mu_1 t - \tfrac12 \sigma_1^2 t^2\Bigr), \quad \phi_Y(t) = \exp\!\Bigl(i \mu_2 t - \tfrac12 \sigma_2^2 t^2\Bigr) \] であり、確率変数が独立であるので、積を取ると
\[\begin{align*} \phi_X(t)\,\phi_Y(t) &= \exp\!\Bigl(i \mu_1 t - \tfrac12 \sigma_1^2 t^2\Bigr) \exp\!\Bigl(i \mu_2 t - \tfrac12 \sigma_2^2 t^2\Bigr) \\ &= \exp\!\Bigl( i (\mu_1 + \mu_2) t \;-\; \tfrac12 (\sigma_1^2 + \sigma_2^2) t^2 \Bigr) \end{align*}\]
これは平均が \(\mu_1 + \mu_2\),分散が \(\sigma_1^2 + \sigma_2^2\) の正規分布を示しています。 \[ N\bigl(\mu_1 + \mu_2,\; \sigma_1^2 + \sigma_2^2\bigr) \]
3. 定数倍の和
確率変数 \(X \sim N(\mu_1, \sigma_1^2)\) と \(Y \sim N(\mu_2, \sigma_2^2)\) が独立であるとします。
また、定数 \(a, b\) を用いて新しい確率変数 \(Z = aX + bY\) を定義します。このとき、以下の性質が成り立ちます。
\[ Z = aX + bY \sim N\bigl(a\mu_1 + b\mu_2, a^2\sigma_1^2 + b^2\sigma_2^2\bigr) \]
3.1. 証明
確率変数 \(Z = aX + bY\) の特性関数 \(\phi_Z(t)\) は次のように定義されます
\[ \phi_Z(t) = E\bigl[e^{i t Z}\bigr] \] ここで \(Z = aX + bY\) を代入すると、
\[ \begin{align*}\phi_Z(t) &= E\bigl[e^{i t (aX + bY)}\bigr] \\ &= E\bigl[e^{i t a X}\bigr] \cdot E\bigl[e^{i t b Y}\bigr] \\ &= \phi_X(at)\,\phi_Y(bt) \end{align*} \]
\(X \sim N(\mu_1, \sigma_1^2)\) と \(Y \sim N(\mu_2, \sigma_2^2)\) の特性関数はそれぞれ \[ \phi_X(t) = \exp\bigl(i \mu_1 t - \tfrac{1}{2} \sigma_1^2 t^2\bigr), \quad \phi_Y(t) = \exp\bigl(i \mu_2 t - \tfrac{1}{2} \sigma_2^2 t^2\bigr) \]
これを \(t\) を \(ta\), \(tb\) に置き換えて計算すると、
\[ \phi_Z(t) = \exp\bigl(i \mu_1 (ta) - \tfrac{1}{2} \sigma_1^2 (ta)^2\bigr) \cdot \exp\bigl(i \mu_2 (tb) - \tfrac{1}{2} \sigma_2^2 (tb)^2\bigr) \]
指数の性質を用いて整理すると、 \[ \phi_Z(t) = \exp\bigl(i (a\mu_1 + b\mu_2) t - \tfrac{1}{2} (a^2\sigma_1^2 + b^2\sigma_2^2) t^2\bigr) \]
この特性関数は、平均 \(a\mu_1 + b\mu_2\)、分散 \(a^2\sigma_1^2 + b^2\sigma_2^2\) の正規分布 \[ Z = aX + bY \sim N\bigl(a\mu_1 + b\mu_2, a^2\sigma_1^2 + b^2\sigma_2^2\bigr) \] に対応します。
4. 例題
4.1. 例題 1:商品の売上合計
ある商品の 1 日あたりの売上個数 \(X_i\) は、平均 \(\mu = 100\) 個、分散 \(\sigma^2 = 400\) (標準偏差 20)の正規分布に従うとします。
\[ X_i \sim N\bigl(100,\; 400\bigr) \]
毎日独立に売上が発生すると仮定したとき、7 日間の売上合計 \[ S_7 = X_1 + X_2 + \cdots + X_7 \] の分布を求めてください。
- 各日 \(X_i\) は \(N(100, 400)\) に従う。
- \[ S_7 = \sum_{i=1}^7 X_i \] は、再生性により正規分布に従う。期待値は\[ E[S_7] = E[X_1] + \cdots + E[X_7] = 7 \times 100 = 700, \] 分散は\[ \mathrm{Var}(S_7) = \mathrm{Var}(X_1) + \cdots + \mathrm{Var}(X_7) = 7 \times 400 = 2800 \]
- よって、\(S_7\) は平均 700、分散 2800 の正規分布 \[ S_7 \sim N(700,\; 2800) \] に従う。
4.2. 例題 2:サンプル平均の分布
ある母集団の平均が \(\mu\)、分散が \(\sigma^2\) であり、そこから大きなサンプルを無作為に抽出するとき、サンプルサイズ \(n\) のサンプル平均 \[ \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i \] が正規分布に近似できる(中心極限定理)という事実があります。ただし、母集団自体がもともと正規分布の場合は、「近似」ではなく、正規分布に従うことが知られています。これを再生性を使って確認してみましょう。
- 各サンプルの分布
母集団が正規分布 \(N(\mu, \sigma^2)\) に従うとすると、抽出されたサンプル \(X_i\) もそれぞれ \[ X_i \sim N(\mu, \sigma^2) \] に従う。かつ、互いに独立である。 - サンプルの和の分布
\[ \sum_{i=1}^n X_i \] は再生性により \[ N\Bigl(n\mu,\; n\sigma^2\Bigr) \] に従う。 - サンプル平均の分布
\[ \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i \]の分布は \[ N\bigl(\mu,\; \tfrac{\sigma^2}{n}\bigr) \]