更新:2024/09/16

正規分布の確率密度関数、期待値と分散、標準正規分布について

ふゅか
ふゅか
今日は正規分布について話そう!

1. 正規分布の特徴

1.1. 正規分布の形状

  • 平均値(μ)を中心に左右対称で、最も高い点が平均値に位置します。
  • 分散(σ²)が小さいと曲線は鋭くなり、大きいと広がります。

μ=0に固定して、異なる分散値を持つ正規分布のグラフを描いてみましょう。例えば、分散が 1、5、10 の正規分布を比較してみます。

上のグラフでは、異なる分散(σ²)を持つ正規分布を示しています。分散が 1、5、10 の場合の曲線を比較しています。

  • 分散が1の場合(青い線)、曲線は非常に鋭く、ピークが高くなっています。
  • 分散が 5の場合(オレンジの線)、曲線は少し広がり、ピークが低くなっています。
  • 分散が10の場合(緑の線)、曲線はさらに広がり、より平らになっています。

これにより、分散が大きくなるにつれて、分布がより広がり、ピークが低くなることが視覚的に確認できます。

ふゅか
ふゅか
標準偏差が大きいとデータは広がっている、小さいと集中しているってことだね。

2. 確率密度関数

正規分布の確率密度関数は次のように表されます。
\[ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) \]

ここで、expは自然対数の底(e ≈ 2.718)の指数関数です。

はるか
はるか
この式が正規分布の確率密度関数。

3. 正規分布の期待値と分散

正規分布の期待値と分散は次のようになる。
$$\mathbb{E}[X] = \mu$$$$\mathbb{V}(X) = \sigma^2$$

確率密度関数から期待値と分散を求めてみましょう。

3.1. 期待値の計算

期待値 \( \mathbb{E}[X] \) は次のように定義されます。

\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} x f(x) \, dx \]

正規分布のPDFを代入して計算します。

\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) \, dx \]

置換積分を行います。

\( u = \frac{x - \mu}{\sigma} \) と置くと、 \( du = \frac{dx}{\sigma} \) となります。

これにより積分範囲は無限範囲なのでそのままです。

\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} (\sigma u + \mu) \cdot \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{u^2}{2} \right) \sigma \, du \]

\[ = \int_{-\infty}^{\infty} \left( \frac{\sigma u}{\sqrt{2\pi}} \exp\left( -\frac{u^2}{2} \right) + \frac{\mu}{\sqrt{2\pi}} \exp\left( -\frac{u^2}{2} \right) \right) \, du \]

\[ = \sigma \int_{-\infty}^{\infty} u \cdot \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{u^2}{2} \right) \, du + \mu \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{u^2}{2} \right) \, du \]

ここで、1つ目の積分は奇関数の積分なので0となります。また、ガウス積分より、

\[ \sigma \cdot 0 + \mu \cdot 1 = \mu \]

したがって、期待値は次のようになります。

\[ \mathbb{E}[X] = \mu \]

3.2. 分散の計算

分散 \( \mathbb{V}[X] \) は次のように定義されます。

\[ \mathbb{V}[X] = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx \]

再び正規分布の確率密度関数を代入します。

\[ \mathbb{V}[X] = \int_{-\infty}^{\infty} (x - \mu)^2 \cdot \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) \, dx \]

同様に変数を置き換えます。

\[ \mathbb{V}[X] = \int_{-\infty}^{\infty} (\sigma u)^2 \cdot \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{u^2}{2} \right) \sigma \, du \]

\[ = \sigma^2 \int_{-\infty}^{\infty} u^2 \cdot \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{u^2}{2} \right) \, du \]

ここで、

\[ \int_{-\infty}^{\infty} u^2 \cdot \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{u^2}{2} \right) \, du = 1 \]

となる。

したがって、分散は、

\[ \mathbb{V}[X] = \sigma^2 \cdot 1 = \sigma^2 \]

4. 標準正規分布

標準正規分布の確率密度関数は次のように表されます。

\[ f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \]

この関数の形状は左右対称で、中心(平均)を基準に左右に広がります。

  1. 平均(期待値): \(0\)
  2. 標準偏差: \(1\)
  3. 分散: 標準偏差の2乗、つまり \(1\)
  4. 形状: 鐘形で、左右対称です。

PR