更新:2024/10/07

二項分布の期待値と分散の導出、例題について

はるか
はるか
二項分布は、成功か失敗の2つの結果しかない試行を繰り返すときの分布。
ふゅか
ふゅか
例えば、コイン投げとかね。コインを何度も投げて、表が何回出るかを考えるのにぴったりだね。それが二項分布で、成功の回数を表すんだよ♪

1. 二項分布

二項分布は、成功か失敗の2つの結果しかない試行(ベルヌーイ試行)を複数回繰り返したときに、成功する回数を表す分布です。たとえば、コインを何度も投げたときに表が出る回数や、テストで正解する問題数など、成功と失敗がはっきりしている現象で使われます。

1.1. 二項分布の確率質量関数

二項分布の確率質量関数は次のように表すことができる。

\[ P(X = k) = {}_n \mathrm{C}_k p^k (1-p)^{n-k} \]

  • \( P(X = k) \):成功回数が \( k \) である確率
  • \( n \):試行回数
  • \( k \):成功回数
  • \( p \):成功する確率

この式では、成功する確率 \( p \) を \( k \) 回成功させ、残りの試行で失敗する確率 \((1-p)\) を掛け合わせて、試行全体の確率を求めます。確率変数Xが二項分布に従うとは、 \( X \sim \mathrm{Bin}(n, p) \)と書かれることがあります。

2. 二項分布の例

2.1. 例1: コイン投げ

コインを10回投げて表が出る回数が何回になるかを考えます。この場合、各試行で表が出る確率 \( p \) は 0.5 です。また、試行回数 \( n \) は10回です。たとえば、表がちょうど6回出る確率を求めるとき、次のように計算できます。

$$\begin{align*} P(X = 6) &= {}_{10} \mathrm{C}_6 (0.5)^6 (0.5)^{4} \\ &= 210 \times \left( \frac{1}{2} \right)^{10} \\ &= \frac{105}{512} \end{align*}$$

つまり、10回のコイン投げで6回表が出る確率はおよそ 0.205 です。

2.2. 例2: 試験の正解数

続きの計算を進めてみましょう。

5問中1問だけ正解する確率を求めるためには、まず組み合わせの数とそれぞれの正解・不正解の確率を使います。

\[ P(X = 1) = {}_5 \mathrm{C}_1 \times \left(\frac{9}{10}\right)^1 \times \left(\frac{1}{10}\right)^4 \]

計算していくと、

$$\begin{align*} P(X = 1) &= 5 \times \frac{9}{10} \times \frac{1}{10000} \\ &= 5 \times \frac{9}{100000} \\ &= \frac{45}{100000} \\ &= 0.00045 \end{align*}$$

したがって、5問中1問だけ正解する確率は 0.00045 です。

3. 期待値

二項分布の期待値は$np$になる。
ふゅか
ふゅか
二項分布の期待値は \( n \) 回試行して、成功確率が \( p \) だから、平均的に \( np \) 回成功するってことだよ!
はるか
はるか
証明でも、期待値の線形性を使って簡単に求められる。

3.1. 二項分布の期待値の証明1

二項分布の期待値 \( \mathbb E[X] \) は、次のように定義されます。

\[\mathbb E[X]= \sum_{k=0}^{n} k P(X = k) = \sum_{k=0}^{n} k {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}\]

この式を整理するために、まず和の中の \( k \) に注目します。 \( k \, {}_n \mathrm{C}_{k} \) の項を扱いやすくするため、二項係数の性質を使って変形します。

\[ k \, {}_n \mathrm{C}_{k} = n \, {}_{n-1} \mathrm{C}_{k-1} \]

この変形を期待値の式に適用すると、

$$\begin{align*} \mathbb{E}[X] &= \sum_{k=0}^{n} n \, {}_{n-1} \mathrm{C}_{k-1} p^k (1-p)^{n-k} \\ &= n \sum_{k=1}^{n} {}_{n-1} \mathrm{C}_{k-1} p^k (1-p)^{n-k} \\ &= np \sum_{k=1}^{n} {}_{n-1} \mathrm{C}_{k-1} p^{k-1} (1-p)^{n-k} \\ &= np \sum_{k=1}^{n} {}_{n-1} \mathrm{C}_{k-1} p^{k-1} (1-p)^{(n-1)-(k-1)} \end{align*}$$

二項定理より、

\[ \mathbb E[X] = n p \]

3.2. 二項分布の期待値の証明2

確率変数 \(X\) は \(n\) 回の独立な成功か失敗を表すベルヌーイ試行の成功回数と解釈できます。したがって、0または1を表す各ベルヌーイ試行を表す確率変数を\(X_i\) として、

\[ X = \sum_{i=1}^{n} X_i \]

期待値の線形性より、

\[ \mathbb E[X]= \mathbb E \left[\sum_{i=1}^{n} X_i \right]= \sum_{i=1}^{n} \mathbb E[X_i] \]

各 \(X_i\) の期待値は次のように計算することができます。

\[ \mathbb E[X_i] = 1\cdot p +0\cdot(1-p) = p\]

したがって、

\[ \mathbb E[X]= \sum_{i=1}^{n} \mathbb E[X_i]=\sum_{i=1}^{n} p = np \]

4. 分散

二項分布の分散は$np(1-p)$になる。
ふゅか
ふゅか
分散も \( np(1-p) \) になるけど、これも結構大事なポイントだよね。
ふゅか
ふゅか
そうだね。二次関数から、成功確率が0.5なら、分散は最大になるって覚えておくと良いかも!

4.1. 二項分布の分散の証明1

\( \mathbb E[X^2] \) は、次のようになります。

\[\mathbb E[X^2]= \sum_{k=0}^{n} k^2 P(X = k) = \sum_{k=0}^{n} k^2 {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}\]

ここで、$k^2=k(k-1)+k$より、

\[\mathbb E[X^2]= \sum_{k=0}^{n} k(k-1) {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}+ \sum_{k=0}^{n} k {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}\]

この式を整理するために、まず和の中の \( k \) に注目します。 \( k \, {}_n \mathrm{C}_{k} \) の項を扱いやすくするため、二項係数の性質を使って変形します。

\[ k(k-1) \, {}_n \mathrm{C}_{k} = n (k-1)\, {}_{n-1} \mathrm{C}_{k-1} = n(n-1)\, {}_{n-2} \mathrm{C}_{k-2} \]

したがって、

$$\begin{align*} \mathbb{E}[X^2] &= \sum_{k=0}^{n} k(k-1) {}_n \mathrm{C}_{k} p^k (1-p)^{n-k} + \sum_{k=0}^{n} k {}_n \mathrm{C}_{k} p^k (1-p)^{n-k} \\ &= n(n-1) p^2 \sum_{k=0}^{n} {}_{n-2} \mathrm{C}_{k-2} p^{k-2} (1-p)^{(n-2)-(k-2)} + \mathbb{E}[X] \end{align*}$$

二項定理より、

$$\mathbb E[X^2]= n(n-1)p^2+np$$

したがって、$\mathbb V[X] = \mathbb E[X^2]-( \mathbb E[X])^2$であるので、

$$\begin{align*} \mathbb{V}[X] &= n(n-1)p^2 + np - n^2p^2 \\ &= np - np^2 \\ &= np(1-p) \end{align*}$$

4.2. 二項分布の分散の証明2

\(X = \sum_{i=1}^{n} X_i\) となるので、

\[ \mathbb {V}[X] = \mathbb V \left[ \sum_{i=1}^{n} X_i \right] \]

ベルヌーイ試行\(X_i\) は独立であるため、

\[ \mathbb V[ X ]= \sum_{i=1}^{n} \mathbb V[ X_i] \]

ここで、$\mathbb E[X_i] = p$より、各 \(X_i\) の分散は次のように計算することができます。

$$\begin{align*} \mathbb{V}[X_i] &= p(1-p)^2 + (1-p)(0-p)^2 \\ &= (1-p)(p(1-p) + p^2) \\ &= (1-p)p \end{align*}$$

したがって、

\[ \mathbb {V}[X] = \sum_{i=1}^{n} \mathbb V[ X_i] = \sum_{i=1}^{n} p(1-p) = np(1-p) \]

5. 例題

5.1. 例題 1:工場の製品

ある工場では、製品を製造する際に不良品が出る確率が 0.1 です。この工場では一度に 20 個の製品を製造します。不良品が出る確率は二項分布に従うとします。このとき、次の問いに答えなさい。

  1. 製造された製品のうち、不良品の個数の期待値を求めなさい。
  2. 不良品の個数の分散を求めなさい。

1.二項分布の期待値は、

\[ E[X] = 20 \times 0.1 = 2 \]

よって、期待値は 2 です。これは、不良品が平均して 2 個出ることを意味します。

2.二項分布の分散は、

\[ \text{V}[X] = 20 \times 0.1 \times (1 - 0.1) = 20 \times 0.1 \times 0.9 = 1.8 \]

よって、分散は 1.8 です。

5.2. 例題 2:アンケート

アンケートにおいて、回答者が「はい」と答える確率は 0.7 です。確率は二項分布に従うとします。このアンケートを 15 人に実施した場合、次の問いに答えなさい。

  1. 15 人のうち「はい」と答える人数の期待値を求めなさい。
  2. 「はい」と答える人数の分散を求めなさい。

1.期待値は、

\[ E[X] = 15 \times 0.7 = 10.5 \]

よって、期待値は 10.5 です。これは、平均して 15 人中 10.5 人が「はい」と答えることを意味します。

2.分散は、

\[ V[X]= 15 \times 0.7 \times (1 - 0.7) = 15 \times 0.7 \times 0.3 = 3.15 \]

よって、分散は 3.15 です。

PR