多項分布の意味と期待値、分散の導出について

1. 多項分布とは?
多項分布は、複数のカテゴリに属するデータの発生回数をモデル化するために使われます。多項分布は二項分布を一般化したもので、二項分布は成功と失敗の2つの結果しかないのに対し、多項分布は3つ以上の異なる結果を扱えるという特徴があります。
1.1. 多項分布の確率関数
多項分布の同時確率は、次のように表されます。
\[ P(X_1 = x_1, X_2 = x_2, \ldots, X_k = x_k) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1} p_2^{x_2} \cdots p_k^{x_k} \]
- \(n\):試行の総数
- \(k\):カテゴリの数
- \(x_i\):各カテゴリの出現回数
- \(p_i\):各カテゴリの発生確率




1.2. 多項分布の例
サイコロの例で考えると、10回サイコロを振ったときに「1が2回、2が3回、3が1回、4が1回、5が2回、6が1回」という結果が得られる確率を求めたいとします。この場合、多項分布を使うと、次のように計算できます:
\[ P(X_1 = 2, X_2 = 3, X_3 = 1, X_4 = 1, X_5 = 2, X_6 = 1) = \frac{10!}{2! 3! 1! 1! 2! 1!} \left(\frac{1}{6}\right)^{2+3+1+1+2+1} \]
2. 期待値 \(E[X_i]\)
2.1. 定義そのまま書き下す
\[ \boxed{\displaystyle E[X_i] =\sum_{\substack{x_1+\dots+x_k=n\\x_r\ge0}} x_i\; \frac{n!}{x_1!\cdots x_i!\cdots x_k!}\; p_1^{x_1}\cdots p_i^{x_i}\cdots p_k^{x_k}} \]
2.2. 分子と分母を分解
まず
\[ x_i!\;=\;x_i\,(x_i-1)! \quad\text{および}\quad n!\;=\;n\,(n-1)! \] を式 (1) に適用し、\(x_i\) を分離します。
\[ \begin{aligned} E[X_i] &=\sum_{\sum x_r=n} \left( x_i \frac{n!}{x_i!} \right) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_k!} \\[4pt] &=\sum_{\sum x_r=n} \left( x_i \frac{n\,(n-1)!}{x_i\,(x_i-1)!} \right) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_k!} \\[4pt] &=\color{blue}{n\;p_i} \sum_{\sum x_r=n} \frac{(n-1)!}{x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_k!} \;p_1^{x_1}\cdots p_i^{x_i-1}\cdots p_k^{x_k} \end{aligned} \]
2.3. 置き換えと全確率
変数変換
\[ y_i=x_i-1,\qquad y_r=x_r\;(r\neq i) \] を行うと
\[ y_1+\dots+y_k=(n-1),\qquad y_r\ge0 \]
右辺の総和は「試行回数 \(n-1\)」の多項分布 全確率 なので 1。
ゆえに
\[ \boxed{E[X_i]=n\,p_i} \]
3. 分散 \(\mathrm{Var}(X_i)\)
分散を直接求めるより
\[ E[X_i(X_i-1)] \] から入るほうが階乗操作が 1 回で済みます。
3.1. \(E[X_i(X_i-1)]\) の導出
\[ \begin{aligned} E[X_i(X_i-1)] &=\sum_{\sum x_r=n} x_i(x_i-1)\; \frac{n!}{x_1!\cdots x_i!\cdots x_k!} p_1^{x_1}\cdots p_k^{x_k} \end{aligned} \]
階乗を 2 段分解
\[ x_i!\;=\;x_i(x_i-1)(x_i-2)!, \qquad n!\;=\;n(n-1)(n-2)! \]
これを式 (3) に入れて約分:
\[ \begin{aligned} E[X_i(X_i-1)] &=\sum_{\sum x_r=n} \left( x_i(x_i-1) \frac{n(n-1)(n-2)!}{x_i(x_i-1)(x_i-2)!} \right) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-2)!\,x_{i+1}!\cdots x_k!}\\[4pt] &=\color{blue}{n(n-1)\,p_i^{2}} \sum_{\sum x_r=n} \frac{(n-2)!}{x_1!\cdots x_{i-1}!\,(x_i-2)!\,x_{i+1}!\cdots x_k!} p_1^{x_1}\cdots p_i^{x_i-2}\cdots p_k^{x_k} \end{aligned} \]
再び変換
\(z_i=x_i-2,\;z_r=x_r\ (r\neq i)\) で
\[ z_1+\dots+z_k=(n-2) \]
したがって総和=1。
\[ \boxed{E[X_i(X_i-1)]=n(n-1)\,p_i^{2}} \]
3.2. 分散の計算
分散公式
\[ \mathrm{Var}(X_i) =E[X_i(X_i-1)] + E[X_i] – \bigl(E[X_i]\bigr)^{2} \]
数値をすべて代入:
\[ \begin{aligned} \mathrm{Var}(X_i) &=n(n-1)p_i^{2} + n p_i – n^{2}p_i^{2}\\ &=np_i\Bigl[(n-1)p_i + 1 – np_i\Bigr]\\ &=np_i\bigl(1-p_i\bigr) \end{aligned} \]
\[ \boxed{\displaystyle\mathrm{Var}(X_i)=n\,p_i\,(1-p_i)} \]
4. 共分散 \(\mathrm{Cov}(X_i,X_j)\)(\(i\neq j\))
4.1. \(E[X_iX_j]\) を求める
\[ \begin{aligned} E[X_iX_j] &=\sum_{\sum x_r=n} x_i\,x_j\; \frac{n!}{x_1!\cdots x_i!\cdots x_j!\cdots x_k!} p_1^{x_1}\cdots p_k^{x_k} \end{aligned} \]
階乗を 1 段ずつ i, j で分解:
\[ \begin{aligned} x_i!\;=&\,x_i\,(x_i-1)!, &\quad x_j!\;=&\,x_j\,(x_j-1)!,\\ n!\;=&\,n\,(n-1)! \end{aligned} \]
よって
\[ \begin{aligned} E[X_iX_j] &=\sum_{\sum x_r=n} \Bigl( x_i x_j \frac{n(n-1)!}{x_i x_j (x_i-1)!(x_j-1)!} \Bigr) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_{j-1}!\,(x_j-1)!\,\dots x_k!}\\[6pt] &=\color{blue}{n(n-1)\,p_i\,p_j} \sum_{\sum x_r=n} \frac{(n-1)!}{x_1!\cdots(x_i-1)!\cdots(x_j-1)!\cdots x_k!}\; p_1^{x_1}\cdots p_i^{x_i-1}\cdots p_j^{x_j-1}\cdots p_k^{x_k} \end{aligned} \]
変換
\(w_i=x_i-1,\;w_j=x_j-1,\;w_r=x_r\ (r\neq i,j)\) で
\[ w_1+\dots+w_k =(n-2) \]
総和=1 なので
\[ \boxed{E[X_iX_j]=n(n-1)\,p_i\,p_j} \]
4.2. 共分散を計算
\[ \begin{aligned} \mathrm{Cov}(X_i,X_j) &=E[X_iX_j] – E[X_i]\,E[X_j]\\[4pt] &=n(n-1)p_i p_j – (np_i)(np_j)\\[4pt] &=-\,n\,p_i\,p_j\\ \end{aligned} \]
\[ \boxed{\displaystyle\mathrm{Cov}(X_i,X_j)=-\,n\,p_i\,p_j\quad(i\neq j)} \]