指数分布の性質と期待値、分散について

私たちの身の回りには、「次に何かが起こるまでの時間」を扱う場面がたくさんあります。たとえば、バスが来るまでの時間、ある機械が故障するまでの時間、あるいは電話が鳴るまでの時間などです。

こうした「待ち時間」をモデル化する際に登場するのが指数分布という確率分布です。

この記事では、指数分布の確率密度関数から始めて、期待値分散の計算方法、さらに指数分布特有の「無記憶性」という性質について、やさしく丁寧に解説していきます。数式にも触れますが、ひとつひとつの意味を理解しながら読み進めていただければ、指数分布がぐっと身近に感じられるはずです。

それでは、まずは指数分布の基本となる確率密度関数から見ていきましょう。

はるか
はるか
指数分布ってどんな分布?

ふゅか
ふゅか
簡単に言うと、「次に何かが起こるまでの時間」を表すときによく使われる分布だよ。

はるか
はるか
なるほど、時間に関係するデータに向いてる。

1. 確率密度関数

指数分布の確率密度関数は次の式で表されます。

f(x)={λeλx(x0)0(x<0)f(x) = \left\{ \begin{array}{ll} \lambda e^{-\lambda x} & (x \geq 0)\\ 0 & (x < 0) \end{array} \right.

2. 期待値と分散

指数分布の期待値E[X]E[X]と分散V[X]V[X]は 次のようになります。

E[X]=1λE[X]=\dfrac{1}{\lambda} V[X]=1λ2V[X]=\dfrac{1}{\lambda^2}

指数分布の期待値と分散の計算は、積分を使用して行います。

2.1.  期待値 E[X] E[X] の計算

期待値は次のようになります。

E(X)=0xf(x) dx=0xλeλxdx E(X) = \int_0^\infty x f(x)  dx = \int_0^\infty x \lambda e^{-\lambda x} \, dx

ここで部分積分を使います。

0xλeλxdx=[xeλx]0+eλxdx\displaystyle\int _0^\infty x\lambda e^{-\lambda x} dx =\displaystyle[ -x e^{-\lambda x} ]_0^\infty + \int e^{-\lambda x} \, dx

無限大での xeλx x e^{-\lambda x} の値は 0 に収束し、下限は 0 です。そのため、残る積分は、

0eλx dx=[1λeλx]0=1λ \int _0^\infty e^{-\lambda x}  dx = \left[\dfrac{-1}{\lambda} e^{-\lambda x} \right]_0^\infty = \frac{1}{\lambda}

したがって、

E(X)=1λ E(X) = \frac{1}{\lambda}

2.2. 分散 V[X] V[X] の計算

分散は Var(X)=E(X2)[E(X)]2 \text{Var}(X) = E(X^2) – [E(X)]^2 で定義されます。まず E(X2) E(X^2) を計算します:

E(X2)=0x2λeλxdx E(X^2) = \int_0^\infty x^2 \lambda e^{-\lambda x} \, dx

部分積分を適用すると、

x2λeλxdx=[x2eλx]0+02xeλxdx \int x^2 \lambda e^{-\lambda x} \, dx = \left[-x^2 e^{-\lambda x} \right]_0^\infty + \int _0^\infty 2x e^{-\lambda x} \, dx

前述の E(X) E(X) の計算で求めた xeλxdx=1λ2 \int x e^{-\lambda x} \, dx = \dfrac{1}{\lambda^2} を利用すると、

02xeλxdx=2×1λ2=2λ2 \int _0^\infty 2x e^{-\lambda x} dx = 2 \times \frac{1}{\lambda^2} = \frac{2}{\lambda^2}

したがって、

E(X2)=2λ2 E(X^2) = \frac{2}{\lambda^2}

よって、分散は

V[X]=2λ2(1λ)2=1λ2 V[X] = \frac{2}{\lambda^2} – \left(\frac{1}{\lambda}\right)^2 = \frac{1}{\lambda^2}

指数分布の期待値と分散が E[X]=1λ E[X] = \dfrac{1}{\lambda} V[X]=1λ2 V[X] = \dfrac{1}{\lambda^2} であることがわかりました。

3.  指数分布の無記憶性

指数分布の特性の一つに「無記憶性」があります。数学的には次のように表されます。

P(X>s+tX>s)=P(X>t) P(X > s + t \mid X > s) = P(X > t)

ふゅか
ふゅか
ある時点での事象が次の時間の事象には依存しないという性質です。

3.1. 無記憶性の証明

指数分布が無記憶性を持つことを示すには、以下の等式を証明します。

P(X>s+tX>s)=P(X>t) P(X > s + t \mid X > s) = P(X > t)

3.1.1. ステップ 1: 左辺の計算

条件付き確率の定義により、左辺は次のように計算できます。

P(X>s+tX>s)=P((X>s+t)(X>s))P(X>s) P(X > s + t \mid X > s) = \frac{P((X > s + t) \cap ( X > s))}{P(X > s)}

(X>s+t)(X>s))(X > s + t) \cap ( X > s))X>s+t X > s + t より、

P(X>s+tX>s)=P(X>s+t)P(X>s) P(X > s + t \mid X > s) = \frac{P(X > s + t)}{P(X > s)}

3.1.2. ステップ 2: P(X>x) P(X > x) の計算

指数分布において、P(X>x)P(X > x)は次のように計算されます。

P(X>x)=xλeλydy=eλx P(X > x) = \int_x^\infty \lambda e^{-\lambda y} \, dy = e^{-\lambda x}

これを使って、分母と分子を計算する。

P(X>s+t)=eλ(s+t) P(X > s + t) = e^{-\lambda (s + t)} P(X>s)=eλs P(X > s) = e^{-\lambda s}

3.1.3. ステップ 3: 条件付き確率の計算

これらを条件付き確率の式に代入します。

P(X>s+tX>s)=eλ(s+t)eλs=eλt=P(X>t) P(X > s + t \mid X > s) = \frac{e^{-\lambda (s + t)}}{e^{-\lambda s}} = e^{-\lambda t} = P(X > t)

これにより、指数分布が無記憶性の性質を持つことが示されました。