更新:2025/02/25

幾何分布の意味と期待値、分散について

はるか
はるか
幾何分布って知ってる?
ふゅか
ふゅか
うん!成功するまでの試行回数を数える確率分布よね!例えば、コインを投げて表が出るまで何回かかるか、ってやつ!

1. 幾何分布とは

幾何分布(Geometric Distribution)は、独立したベルヌーイ試行において、最初に成功するまでに必要な試行回数を確率変数とする離散型確率分布です。たとえば、コインを投げ続けて表が出るまでの回数や、ある製品が最初に故障するまでの試行回数などをモデル化する際に用いられます。

幾何分布には2つの定義があります。

  • 型 I(開始成功型):最初の成功が出るまでの試行回数をカウントする。
  • 型 II(成功回数型):最初の成功が出るまでの失敗回数をカウントする。

本記事では、型 I の幾何分布について詳しく説明します。

2. 幾何分布の確率質量関数(PMF)

試行ごとに成功確率が p p であるベルヌーイ試行を考えます。幾何分布では最初の成功が k k 回目に起こる確率は次のように表されます。

P(X=k)=(1p)k1p,k=1,2,3, P(X = k) = (1 - p)^{k-1} p, \quad k = 1, 2, 3, \dots

ここで、

  • p p は成功確率( 0<p1 0 < p \leq 1
  • (1p)k1 (1 - p)^{k-1} k1 k-1 回連続して失敗する確率
  • p p k k 回目に成功する確率

3. 幾何分布の性質

3.1. 期待値(Mean)

幾何分布の期待値は次のようになります。

E[X]=1p E[X] = \frac{1}{p}

期待値 E[X] E[X] は定義より

E[X]  =  k=1kP(X=k)  =  k=1kp(1p)k1 E[X] \;=\; \sum_{k=1}^{\infty} k \cdot P(X = k) \;=\; \sum_{k=1}^{\infty} k \, p \,(1-p)^{\,k-1}

ここで,級数の形を整理します。まず,p p は定数なので外に出すと,

E[X]  =  pk=1k(1p)k1 E[X] \;=\; p \sum_{k=1}^{\infty} k \,(1-p)^{\,k-1}

この無限和の処理には,次の無限等比級数の公式を使います:

k=0xk=11x(x<1), \sum_{k=0}^{\infty} x^k = \frac{1}{1 - x} \quad (\lvert x \rvert < 1),

この級数を微分すると次のような級数が得られます。

k=1kxk1=1(1x)2(x<1) \sum_{k=1}^{\infty} k\,x^{k-1} = \frac{1}{(1 - x)^2} \quad (\lvert x \rvert < 1)

ここで,x=1p x = 1 - p とおけば 1p<1\lvert 1-p \rvert < 1(ただし 0<p<10 < p < 1 が前提)なので,後者の式より

k=1k(1p)k1  =  1(1(1p))2  =  1p2 \sum_{k=1}^{\infty} k \,(1-p)^{\,k-1} \;=\; \frac{1}{(1 - (1-p))^2} \;=\; \frac{1}{p^2}

従って,

E[X]  =  p1p2  =  1p E[X] \;=\; p \cdot \frac{1}{p^2} \;=\; \frac{1}{p}

3.2. 分散(Variance)

幾何分布の分散は次のように表されます。

Var(X)=1pp2 \text{Var}(X) = \frac{1 - p}{p^2}

成功確率が小さいほど、試行回数の変動が大きくなることを意味します。

分散は定義より

Var(X)  =  E[X2]    (E[X])2 \mathrm{Var}(X) \;=\; E[X^2] \;-\; (E[X])^2

したがって,E[X2] E[X^2] を求める必要があります。まずは

E[X2]  =  k=1k2P(X=k)  =  k=1k2p(1p)k1 E[X^2] \;=\; \sum_{k=1}^{\infty} k^2 \cdot P(X = k) \;=\; \sum_{k=1}^{\infty} k^2 \, p \,(1-p)^{k-1}

これを直接計算してもよいですが,下記のように E[X(X1)] E[X(X-1)] を先に計算する」 と計算が楽になります。

E[X(X1)]=k=1k(k1)p(1p)k1 E[X(X-1)] = \sum_{k=1}^{\infty} k(k-1)\, p\,(1-p)^{k-1}

ところが,k(k1) k(k-1) k=1 k=1 のとき 0 ですから,実質的に k2 k \ge 2 で考えられます。そこで次のような等比級数の拡張形を使います。

期待値の時と同様に、微分して得られる公式:

k=2k(k1)xk2  =  2(1x)3(x<1) \sum_{k=2}^{\infty} k(k-1) \, x^{k-2} \;=\; \frac{2}{(1 - x)^3} \quad (\lvert x \rvert < 1)

これを x=1p x = 1-p とすると,

k=2k(k1)(1p)k2  =  2(1(1p))3  =  2p3 \sum_{k=2}^{\infty} k(k-1) \,(1-p)^{k-2} \;=\; \frac{2}{(1-(1-p))^3} \;=\; \frac{2}{p^3}

一方,我々が欲しいのは k(k1)(1p)k1 k(k-1)\,(1-p)^{k-1} なので,ひとつ次元(指数)がずれています。そこで

k(k1)(1p)k1  =  k(k1)(1p)k2(1p) k(k-1)\,(1-p)^{k-1} \;=\; k(k-1)\,(1-p)^{k-2} \,\cdot (1-p)

よって

k=2k(k1)(1p)k1  =  (1p)k=2k(k1)(1p)k2 \sum_{k=2}^{\infty} k(k-1)\,(1-p)^{k-1} \;=\; (1-p)\sum_{k=2}^{\infty} k(k-1)\,(1-p)^{k-2}

上の結果を使うと

k=2k(k1)(1p)k1  =  (1p)2p3  =  2(1p)p3 \sum_{k=2}^{\infty} k(k-1)\,(1-p)^{k-1} \;=\; (1-p) \cdot \frac{2}{p^3} \;=\; \frac{2(1-p)}{p^3}

これに k=1 k=1 の項(値は 0)も加えて問題ないので,

k=1k(k1)(1p)k1  =  2(1p)p3 \sum_{k=1}^{\infty} k(k-1)\,(1-p)^{k-1} \;=\; \frac{2(1-p)}{p^3}

最後に p p を掛ければ

E[X(X1)]  =  p2(1p)p3  =  2(1p)p2 E[X(X-1)] \;=\; p \cdot \frac{2(1-p)}{p^3} \;=\; \frac{2(1-p)}{p^2}

E[X2] E[X^2] の導出を行うと、

E[X2]=E[X(X1)]+E[X]=2(1p)p2  +  1p E[X^2] = E[X(X-1)] + E[X] = \frac{2(1-p)}{p^2} \;+\; \frac{1}{p}

両方を足し合わせると

E[X2]=2(1p)p2  +  1p=2(1p)p2+1ppp=2(1p)+pp2=22p+pp2=2pp2 E[X^2] = \frac{2(1-p)}{p^2} \;+\; \frac{1}{p} = \frac{2(1-p)}{p^2} + \frac{1}{p}\cdot\frac{p}{p} = \frac{2(1-p) + p}{p^2} = \frac{2 - 2p + p}{p^2} = \frac{2 - p}{p^2}

分散を求めると

Var(X)=E[X2](E[X])2=2pp2(1p)2=2pp21p2=2p1p2=1pp2 \mathrm{Var}(X) = E[X^2] - (E[X])^2 = \frac{2 - p}{p^2} - \left(\frac{1}{p}\right)^2 = \frac{2 - p}{p^2} - \frac{1}{p^2} = \frac{2 - p - 1}{p^2} = \frac{1 - p}{p^2}

PR