更新:2025/01/05

ポアソン分布の意味と性質について

はるか
はるか
ポアソン分布…一定の時間や空間で発生する回数をモデル化する確率分布
ふゅか
ふゅか
そうそう!例えば、1時間あたりの電話の回数とか、すごく便利よね!

1. ポアソン分布とは

ポアソン分布(Poisson distribution)は、ある一定の時間内や空間内で発生する事象の回数をモデル化する確率分布です。

ポアソン分布は、以下の確率質量関数で定義されます。

\[ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \]

  • \( X \) は事象の発生回数を表す確率変数。
  • \( k \) は事象が発生する回数(0, 1, 2, …)。
  • \( \lambda \) は一定の時間内や空間内での事象の平均発生回数。
  • \( e \) はネイピア数(約2.718)。

1.1. ポアソン分布のグラフ

上記のグラフは、異なるλ(平均発生率)を用いたポアソン分布の確率質量関数(PMF)を示しています。それぞれの線は、λ = 1、4、10の場合の発生回数 \( x \) に対する確率を表しています。ポアソン分布の特徴として、λが大きくなるほど分布が広がり、平均値と分散がλに近づくことがわかります。

2. ポアソン分布の導出

二項分布 \(\mathrm{Binomial}(n, p)\) が,\(n \to \infty\) かつ \(np = \lambda\) となるとき、ポアソン分布 \(\mathrm{Poisson}(\lambda)\) に収束する。

二項分布 \(X \sim \mathrm{Binomial}(n, p)\) の確率質量関数

\[ P(X = k) = {}_nC_k \, p^k (1-p)^{n-k} = \frac{n!}{k!(n-k)!} \, p^k (1-p)^{n-k} \quad (k = 0, 1, 2, \dots, n) \]

です。

ポアソン分布への極限を考えるため,\(\lambda = np\) が一定となるように \(n \to \infty\) とします。このとき \(\displaystyle p = \frac{\lambda}{n}\) とすると二項分布の確率質量関数は

\[ P(X = k) = {}_nC_k \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} \]

となります。

上式をポアソン分布の形に近付けるため,以下の 2 つの積に分割して考えます。

1. \(\displaystyle \frac{n!}{(n-k)!} \left(\frac{\lambda}{n}\right)^k\)
2. \(\displaystyle \left(1 - \frac{\lambda}{n}\right)^{n-k}\)

[1] まずは

\[ \frac{n!}{(n-k)!} \left(\frac{\lambda}{n}\right)^k = \underbrace{\frac{n(n-1)\cdots(n-k+1)}{n^k}}_{\text{ここが }k\text{ 個の積}} \, \lambda^k. \]

ここで、それぞれの要素をみると

\[ \frac{n-i}{n} = 1 - \frac{i}{n} \quad (i = 0, 1, \dots, k-1) \]

は \(n \to \infty\) で 1 に近付きます。よって,積全体としては

\[ \frac{n(n-1)\cdots(n-k+1)}{n^k} \xrightarrow[n \to \infty]{} 1. \]

したがって

\[ \frac{n!}{(n-k)!} \left(\frac{\lambda}{n}\right)^k \xrightarrow[n \to \infty]{} \lambda^k. \]

[2] 次に

\[ \left(1 - \frac{\lambda}{n}\right)^{n-k} = \left(1 - \frac{\lambda}{n}\right)^n \cdot \left(1 - \frac{\lambda}{n}\right)^{-k} \]

と分解します。ここで、

  • \(\displaystyle \lim_{n \to \infty} \left(1 - \frac{\lambda}{n}\right)^n = e^{-\lambda}\)
  • \(\displaystyle \lim_{n \to \infty} \left(1 - \frac{\lambda}{n}\right)^{-k} = 1\)

より、積全体は

\[ \left(1 - \frac{\lambda}{n}\right)^{n-k} \xrightarrow[n \to \infty]{} e^{-\lambda} \]

上記の結果を合わせると、

\[ P(X = k) = {}_nC_k \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} \]

\[ \underbrace{ \frac{1}{k!} \cdot \frac{n!}{(n-k)!} \left(\frac{\lambda}{n}\right)^k }_{\to \frac{\lambda^k}{k!}} \quad \times \quad \underbrace{ \left(1 - \frac{\lambda}{n}\right)^{n-k} }_{\to e^{-\lambda}} \]

となり,\(n \to \infty\) で

\[ \frac{\lambda^k}{k!} \, e^{-\lambda} \]

に収束します。これはちょうどパラメータ \(\lambda\) のポアソン分布

\[ \mathrm{Poisson}(\lambda) \quad \text{の確率質量関数} \quad P(X = k) = \frac{\lambda^k}{k!} e^{-\lambda} \]

3. ポアソン分布の期待値と分散

ふゅか
ふゅか
期待値と分散がどちらもλに等しいのってシンプルで素敵だよね!
はるか
はるか
うん、計算も簡単。導出ではマクローリン展開を使うのがポイント。
ポアソン分布の期待値と分散はどちらも \( \lambda \) に等しいです。

$$ \mathbb E[X] = \lambda $$

$$\mathbb  V [X] = \lambda $$

3.1. マクローリン展開を利用した期待値の導出

期待値 \( \mathbb{E}[X] \) は次のように定義されます。

\[ \mathbb{E}[X] = \sum_{k=0}^{\infty} k \cdot P(X = k) = \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k e^{-\lambda}}{k!} \]

まず、この式を \( k \) を \( k! \) に含まれる項に分解します:

\[ \mathbb{E}[X] = \sum_{k=1}^{n} \frac{k \lambda^k e^{-\lambda}}{k!} = \sum_{k=1}^{n} \frac{\lambda^k e^{-\lambda}}{(k-1)!} \]

関係のない項をシグマの外に出して

\[ \mathbb{E}[X] = \lambda e^{-\lambda} \sum_{k=0}^{n-1}\frac{\lambda^{k-1}}{(k-1)!} \]

$e^x$のマクローリン展開より、

\[ \mathbb{E}[X] = \lambda e^{-\lambda} \sum_{k=0}^{n-1}\frac{\lambda^{k-1}}{(k-1)!}= \lambda e^{\lambda} \cdot e^{-\lambda} = \lambda \]

次に、分散を求めます。分散は

\[ \mathbb{V}[X] = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 \]

まず、\( \mathbb{E}[X^2] \) を求めます:

\[ \mathbb{E}[X^2] = \sum_{k=0}^{n} k^2 \cdot P(X = k) = \sum_{k=0}^{n} k^2 \frac{\lambda^k e^{-\lambda}}{k!} \]

\( k^2 \) を次のように分解できます:

\[ k^2 = k(k-1) + k \]

したがって、

\[ \mathbb{E}[X^2] = \sum_{k=0}^{n} \left( k(k-1) + k \right) \frac{\lambda^k e^{-\lambda}}{k!} \]

これを分割して次のように書き直します:

\[ \mathbb{E}[X^2] = \sum_{k=0}^{n} k(k-1) \frac{\lambda^k e^{-\lambda}}{k!} + \sum_{k=0}^{n} k \frac{\lambda^k e^{-\lambda}}{k!} \]

最初の和は、次のように計算することができます。

\[ \begin{align*}\sum_{k=0}^{n} k(k-1) \frac{\lambda^k e^{-\lambda}}{k!} &= \sum_{k=2}^{n}  \frac{\lambda^k e^{-\lambda}}{(k-2)!} \\ &= \lambda^2 e^{-\lambda}\sum_{k=2}^{n}  \frac{\lambda^{k-2} }{(k-2)!} \\ &= \lambda^2 e^{-\lambda} e^{\lambda}\\ &= \lambda^2 \end{align*}\]

2番目の和は先ほどの期待値で、すでに \( \lambda \) であることがわかっています:

\[ \sum_{k=0}^{n} k \frac{\lambda^k e^{-\lambda}}{k!} = \lambda \]

これらを組み合わせると、

\[ \mathbb{E}[X^2] = \lambda^2 + \lambda \]

したがって、分散は

\[ \mathbb{V}[X] = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 = (\lambda^2 + \lambda) - \lambda^2 = \lambda \]

3.2. 近似を利用した導出

二項分布の期待値と分散は

\[ \mathbb{E}[X] = np=\lambda \]

\[ \mathbb{V}[X] = np(1-p) =\lambda(1-p) \]

となります。ここで、ポアソン分布では$n\to \infty$、確率pが非常に小さいので、1-pを1として近似すると、

\[ \mathbb{E}[X] = np=\lambda \]

\[ \mathbb{V}[X] = np=\lambda \]

4. ポアソン分布の例題

1時間あたり平均で10件の電話が来ると予想される。1時間内に特定の件数の電話が来る確率がポアソン分布に従うとき、1時間に5件の電話が来る確率を計算しなさい。

\( \lambda = 10 \) として、次のように計算できます:

\[ P(X = 5) = \frac{10^5 e^{-10}}{5!} \approx 0.0378 \]

この確率は約3.78%となります。

 

PR