更新:2025/03/16

負の二項分布とは?意味や期待値・分散をわかりやすく解説

「ある作業を成功させるまでに何回挑戦する必要があるのか?」

日常生活でも、ゲームや仕事、実験などで「何回目でうまくいくのか」を考える場面は多いでしょう。例えば、サイコロを振って3回「6」を出すまでに何回振ることになるのか? という問題があります。

このような「ある成功回数に到達するまでに必要な試行回数」を確率的に表すのが 負の二項分布(Negative Binomial Distribution) です。幾何分布の一般化ともいえるこの分布となっています。

本記事では、負の二項分布の意味・確率質量関数・期待値・分散の求め方を、解説 していきます。証明も交えながら、直感的に理解できるように進めていきましょう!

はるか
はるか
サイコロを振って3回「6」が出るまでの回数、どれくらいかかると思う?

ふゅか
ふゅか
うーん、運が良ければすぐに出るけど、なかなか出ないと10回以上振ることもあるわね!

はるか
はるか
その「どれくらいかかるか」を確率的に考えるのが負の二項分布。

1. 負の二項分布

負の二項分布は、確率論や統計学で用いられる離散型確率分布の一つで、成功確率$p$のベルヌーイ試行を繰り返したときに、$r$回目の成功が得られるまでの試行回数を表します。

負の二項分布の確率質量関数(PMF)は、次のようになります。

\[ P(X = k) = {}_{k-1}\mathrm C_{r-1} \cdot p^r (1-p)^{k-r} \quad (k = r, r+1, r+2, \dots) \]

ここで:

  • \( {}_{k-1}\mathrm C_{r-1} \) は二項係数であり、組み合わせの数を表します。
  • \( p \) は各試行での成功確率。
  • \( 1-p \) は各試行での失敗確率。
  • \( r \) は成功の目標回数。
  • \( k \) は試行回数(成功と失敗を合わせた総回数)。

二項係数 \( {}_{k-1}\mathrm C_{r-1}\) は以下のように計算できます。

\[ {}_{k-1}\mathrm C_{r-1} = \frac{(k-1)!}{(r-1)! (k-r)!} \]

ふゅか
ふゅか
負の二項分布って、要するに「$r$回成功するまでに何回試行が必要か」っていう分布ね!

2. 期待値

負の二項分布の期待値は次のようになる。

\[ E[X] = \frac{r}{p} \]

負の二項分布は「幾何分布の一般化」と考えられるため、負の二項分布は \( r \) 個の独立な幾何分布の和として表せるという性質を利用します。

\[ X = X_1 + X_2 + \dots + X_r \]

ここで、各 \( X_i \) は成功確率 \( p \) の幾何分布 \( \text{Geom}(p) \) に従い、それぞれの期待値は

\[ E[X_i] = \frac{1}{p} \]

したがって、線形性より

\[ E[X] = E[X_1] + E[X_2] + \dots + E[X_r] = r \cdot \frac{1}{p} = \frac{r}{p} \]

これで、負の二項分布の期待値が

\[ E[X] = \frac{r}{p} \]

3. 分散

負の二項分布の分散は次のようになる。

\[ \text{Var}(X) = \frac{r(1-p)}{p^2} \]

独立である確率変数である場合、以下の式が成り立ちます。

\[ \text{Var}(X) = \sum_{i=1}^{r} \text{Var}(X_i) \]

幾何分布 \( X_i \sim \text{Geom}(p) \) の分散は以下のように知られています。

\[ \text{Var}(X_i) = \frac{1-p}{p^2} \]

したがって、負の二項分布 \( X = X_1 + X_2 + \dots + X_r \) の分散は、

\[ \text{Var}(X) = r \cdot \frac{1-p}{p^2} \]

これで、負の二項分布の分散が

\[ \text{Var}(X) = \frac{r(1-p)}{p^2} \]

 

PR