二項分布の期待値と分散の導出、例題について



1. 二項分布
二項分布は、成功か失敗の2つの結果しかない試行(ベルヌーイ試行)を複数回繰り返したときに、成功する回数を表す分布です。たとえば、コインを何度も投げたときに表が出る回数や、テストで正解する問題数など、成功と失敗がはっきりしている現象で使われます。
1.1. 二項分布の確率質量関数
\[ P(X = k) = {}_n \mathrm{C}_k p^k (1-p)^{n-k} \]
- \( P(X = k) \):成功回数が \( k \) である確率
- \( n \):試行回数
- \( k \):成功回数
- \( p \):成功する確率
この式では、成功する確率 \( p \) を \( k \) 回成功させ、残りの試行で失敗する確率 \((1-p)\) を掛け合わせて、試行全体の確率を求めます。確率変数Xが二項分布に従うとは、 \( X \sim \mathrm{Bin}(n, p) \)と書かれることがあります。
2. 二項分布の例
2.1. 例1: コイン投げ
コインを10回投げて表が出る回数が何回になるかを考えます。この場合、各試行で表が出る確率 \( p \) は 0.5 です。また、試行回数 \( n \) は10回です。たとえば、表がちょうど6回出る確率を求めるとき、次のように計算できます。
$$\begin{align*} P(X = 6) &= {}_{10} \mathrm{C}_6 (0.5)^6 (0.5)^{4} \\ &= 210 \times \left( \frac{1}{2} \right)^{10} \\ &= \frac{105}{512} \end{align*}$$
つまり、10回のコイン投げで6回表が出る確率はおよそ 0.205 です。
2.2. 例2: 試験の正解数
続きの計算を進めてみましょう。
5問中1問だけ正解する確率を求めるためには、まず組み合わせの数とそれぞれの正解・不正解の確率を使います。
\[ P(X = 1) = {}_5 \mathrm{C}_1 \times \left(\frac{9}{10}\right)^1 \times \left(\frac{1}{10}\right)^4 \]
計算していくと、
$$\begin{align*} P(X = 1) &= 5 \times \frac{9}{10} \times \frac{1}{10000} \\ &= 5 \times \frac{9}{100000} \\ &= \frac{45}{100000} \\ &= 0.00045 \end{align*}$$
したがって、5問中1問だけ正解する確率は 0.00045 です。
3. 期待値


3.1. 二項分布の期待値の証明1
二項分布の期待値 \( \mathbb E[X] \) は、次のように定義されます。
\[\mathbb E[X]= \sum_{k=0}^{n} k P(X = k) = \sum_{k=0}^{n} k {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}\]
この式を整理するために、まず和の中の \( k \) に注目します。 \( k \, {}_n \mathrm{C}_{k} \) の項を扱いやすくするため、二項係数の性質を使って変形します。
\[ k \, {}_n \mathrm{C}_{k} = n \, {}_{n-1} \mathrm{C}_{k-1} \]
この変形を期待値の式に適用すると、
$$\begin{align*} \mathbb{E}[X] &= \sum_{k=0}^{n} n \, {}_{n-1} \mathrm{C}_{k-1} p^k (1-p)^{n-k} \\ &= n \sum_{k=1}^{n} {}_{n-1} \mathrm{C}_{k-1} p^k (1-p)^{n-k} \\ &= np \sum_{k=1}^{n} {}_{n-1} \mathrm{C}_{k-1} p^{k-1} (1-p)^{n-k} \\ &= np \sum_{k=1}^{n} {}_{n-1} \mathrm{C}_{k-1} p^{k-1} (1-p)^{(n-1)-(k-1)} \end{align*}$$
二項定理より、
\[ \mathbb E[X] = n p \]
3.2. 二項分布の期待値の証明2
確率変数 \(X\) は \(n\) 回の独立な成功か失敗を表すベルヌーイ試行の成功回数と解釈できます。したがって、0または1を表す各ベルヌーイ試行を表す確率変数を\(X_i\) として、
\[ X = \sum_{i=1}^{n} X_i \]
期待値の線形性より、
\[ \mathbb E[X]= \mathbb E \left[\sum_{i=1}^{n} X_i \right]= \sum_{i=1}^{n} \mathbb E[X_i] \]
各 \(X_i\) の期待値は次のように計算することができます。
\[ \mathbb E[X_i] = 1\cdot p +0\cdot(1-p) = p\]
したがって、
\[ \mathbb E[X]= \sum_{i=1}^{n} \mathbb E[X_i]=\sum_{i=1}^{n} p = np \]
4. 分散


4.1. 二項分布の分散の証明1
\( \mathbb E[X^2] \) は、次のようになります。
\[\mathbb E[X^2]= \sum_{k=0}^{n} k^2 P(X = k) = \sum_{k=0}^{n} k^2 {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}\]
ここで、$k^2=k(k-1)+k$より、
\[\mathbb E[X^2]= \sum_{k=0}^{n} k(k-1) {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}+ \sum_{k=0}^{n} k {}_n \mathrm{C}_{k} p^k(1-p)^{n-k}\]
この式を整理するために、まず和の中の \( k \) に注目します。 \( k \, {}_n \mathrm{C}_{k} \) の項を扱いやすくするため、二項係数の性質を使って変形します。
\[ k(k-1) \, {}_n \mathrm{C}_{k} = n (k-1)\, {}_{n-1} \mathrm{C}_{k-1} = n(n-1)\, {}_{n-2} \mathrm{C}_{k-2} \]
したがって、
$$\begin{align*} \mathbb{E}[X^2] &= \sum_{k=0}^{n} k(k-1) {}_n \mathrm{C}_{k} p^k (1-p)^{n-k} + \sum_{k=0}^{n} k {}_n \mathrm{C}_{k} p^k (1-p)^{n-k} \\ &= n(n-1) p^2 \sum_{k=0}^{n} {}_{n-2} \mathrm{C}_{k-2} p^{k-2} (1-p)^{(n-2)-(k-2)} + \mathbb{E}[X] \end{align*}$$
二項定理より、
$$\mathbb E[X^2]= n(n-1)p^2+np$$
したがって、$\mathbb V[X] = \mathbb E[X^2]-( \mathbb E[X])^2$であるので、
$$\begin{align*} \mathbb{V}[X] &= n(n-1)p^2 + np - n^2p^2 \\ &= np - np^2 \\ &= np(1-p) \end{align*}$$
4.2. 二項分布の分散の証明2
\(X = \sum_{i=1}^{n} X_i\) となるので、
\[ \mathbb {V}[X] = \mathbb V \left[ \sum_{i=1}^{n} X_i \right] \]
ベルヌーイ試行\(X_i\) は独立であるため、
\[ \mathbb V[ X ]= \sum_{i=1}^{n} \mathbb V[ X_i] \]
ここで、$\mathbb E[X_i] = p$より、各 \(X_i\) の分散は次のように計算することができます。
$$\begin{align*} \mathbb{V}[X_i] &= p(1-p)^2 + (1-p)(0-p)^2 \\ &= (1-p)(p(1-p) + p^2) \\ &= (1-p)p \end{align*}$$
したがって、
\[ \mathbb {V}[X] = \sum_{i=1}^{n} \mathbb V[ X_i] = \sum_{i=1}^{n} p(1-p) = np(1-p) \]
5. 例題
5.1. 例題 1:工場の製品
- 製造された製品のうち、不良品の個数の期待値を求めなさい。
- 不良品の個数の分散を求めなさい。
1.二項分布の期待値は、
\[ E[X] = 20 \times 0.1 = 2 \]
よって、期待値は 2 です。これは、不良品が平均して 2 個出ることを意味します。
2.二項分布の分散は、
\[ \text{V}[X] = 20 \times 0.1 \times (1 - 0.1) = 20 \times 0.1 \times 0.9 = 1.8 \]
よって、分散は 1.8 です。
5.2. 例題 2:アンケート
- 15 人のうち「はい」と答える人数の期待値を求めなさい。
- 「はい」と答える人数の分散を求めなさい。
1.期待値は、
\[ E[X] = 15 \times 0.7 = 10.5 \]
よって、期待値は 10.5 です。これは、平均して 15 人中 10.5 人が「はい」と答えることを意味します。
2.分散は、
\[ V[X]= 15 \times 0.7 \times (1 - 0.7) = 15 \times 0.7 \times 0.3 = 3.15 \]
よって、分散は 3.15 です。