更新:2025/04/22

多項分布の意味と期待値、分散の導出について

1. 多項分布とは?

多項分布は、複数のカテゴリに属するデータの発生回数をモデル化するために使われます。多項分布は二項分布を一般化したもので、二項分布は成功と失敗の2つの結果しかないのに対し、多項分布は3つ以上の異なる結果を扱えるという特徴があります。

1.1. 多項分布の確率関数

多項分布の同時確率は、次のように表されます。

\[ P(X_1 = x_1, X_2 = x_2, \ldots, X_k = x_k) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1} p_2^{x_2} \cdots p_k^{x_k} \]

  • \(n\):試行の総数
  • \(k\):カテゴリの数
  • \(x_i\):各カテゴリの出現回数
  • \(p_i\):各カテゴリの発生確率
ふゅか
ふゅか
多項分布って聞いたことある?
はるか
はるか
うん。二項分布の拡張。カテゴリが3つ以上あるやつ。
ふゅか
ふゅか
そうそう!たとえばサイコロを10回振って、「1が2回出た」とか「6が1回だけ」とか、そういう出現数の組み合わせを扱えるんだよね。
はるか
はるか
組み合わせの数と、それぞれの出やすさを考える。式にすると、ちょっと複雑。

1.2. 多項分布の例

サイコロの例で考えると、10回サイコロを振ったときに「1が2回、2が3回、3が1回、4が1回、5が2回、6が1回」という結果が得られる確率を求めたいとします。この場合、多項分布を使うと、次のように計算できます:

\[ P(X_1 = 2, X_2 = 3, X_3 = 1, X_4 = 1, X_5 = 2, X_6 = 1) = \frac{10!}{2! 3! 1! 1! 2! 1!} \left(\frac{1}{6}\right)^{2+3+1+1+2+1} \]

2. 期待値 \(E[X_i]\)

2.1. 定義そのまま書き下す

\[ \boxed{\displaystyle E[X_i] =\sum_{\substack{x_1+\dots+x_k=n\\x_r\ge0}} x_i\; \frac{n!}{x_1!\cdots x_i!\cdots x_k!}\; p_1^{x_1}\cdots p_i^{x_i}\cdots p_k^{x_k}} \]

2.2. 分子と分母を分解

まず

\[ x_i!\;=\;x_i\,(x_i-1)! \quad\text{および}\quad n!\;=\;n\,(n-1)! \] を式 (1) に適用し、\(x_i\) を分離します。

\[ \begin{aligned} E[X_i] &=\sum_{\sum x_r=n} \left( x_i \frac{n!}{x_i!} \right) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_k!} \\[4pt] &=\sum_{\sum x_r=n} \left( x_i \frac{n\,(n-1)!}{x_i\,(x_i-1)!} \right) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_k!} \\[4pt] &=\color{blue}{n\;p_i} \sum_{\sum x_r=n} \frac{(n-1)!}{x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_k!} \;p_1^{x_1}\cdots p_i^{x_i-1}\cdots p_k^{x_k} \end{aligned} \]

2.3. 置き換えと全確率

変数変換

\[ y_i=x_i-1,\qquad y_r=x_r\;(r\neq i) \] を行うと

\[ y_1+\dots+y_k=(n-1),\qquad y_r\ge0 \]

右辺の総和は「試行回数 \(n-1\)」の多項分布 全確率 なので 1。

ゆえに

\[ \boxed{E[X_i]=n\,p_i} \]

3. 分散 \(\mathrm{Var}(X_i)\)

分散を直接求めるより

\[ E[X_i(X_i-1)] \] から入るほうが階乗操作が 1 回で済みます。

3.1.  \(E[X_i(X_i-1)]\) の導出

\[ \begin{aligned} E[X_i(X_i-1)] &=\sum_{\sum x_r=n} x_i(x_i-1)\; \frac{n!}{x_1!\cdots x_i!\cdots x_k!} p_1^{x_1}\cdots p_k^{x_k} \end{aligned} \]

階乗を 2 段分解

\[ x_i!\;=\;x_i(x_i-1)(x_i-2)!, \qquad n!\;=\;n(n-1)(n-2)! \]

これを式 (3) に入れて約分:

\[ \begin{aligned} E[X_i(X_i-1)] &=\sum_{\sum x_r=n} \left( x_i(x_i-1) \frac{n(n-1)(n-2)!}{x_i(x_i-1)(x_i-2)!} \right) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-2)!\,x_{i+1}!\cdots x_k!}\\[4pt] &=\color{blue}{n(n-1)\,p_i^{2}} \sum_{\sum x_r=n} \frac{(n-2)!}{x_1!\cdots x_{i-1}!\,(x_i-2)!\,x_{i+1}!\cdots x_k!} p_1^{x_1}\cdots p_i^{x_i-2}\cdots p_k^{x_k} \end{aligned} \]

再び変換

\(z_i=x_i-2,\;z_r=x_r\ (r\neq i)\) で

\[ z_1+\dots+z_k=(n-2) \]

したがって総和=1。

\[ \boxed{E[X_i(X_i-1)]=n(n-1)\,p_i^{2}} \]

3.2. 分散の計算

分散公式

\[ \mathrm{Var}(X_i) =E[X_i(X_i-1)] + E[X_i] – \bigl(E[X_i]\bigr)^{2} \]

数値をすべて代入:

\[ \begin{aligned} \mathrm{Var}(X_i) &=n(n-1)p_i^{2} + n p_i – n^{2}p_i^{2}\\ &=np_i\Bigl[(n-1)p_i + 1 – np_i\Bigr]\\ &=np_i\bigl(1-p_i\bigr) \end{aligned} \]

\[ \boxed{\displaystyle\mathrm{Var}(X_i)=n\,p_i\,(1-p_i)} \]

4. 共分散 \(\mathrm{Cov}(X_i,X_j)\)(\(i\neq j\))

4.1.  \(E[X_iX_j]\) を求める

\[ \begin{aligned} E[X_iX_j] &=\sum_{\sum x_r=n} x_i\,x_j\; \frac{n!}{x_1!\cdots x_i!\cdots x_j!\cdots x_k!} p_1^{x_1}\cdots p_k^{x_k} \end{aligned} \]

階乗を 1 段ずつ i, j で分解:

\[ \begin{aligned} x_i!\;=&\,x_i\,(x_i-1)!, &\quad x_j!\;=&\,x_j\,(x_j-1)!,\\ n!\;=&\,n\,(n-1)! \end{aligned} \]

よって

\[ \begin{aligned} E[X_iX_j] &=\sum_{\sum x_r=n} \Bigl( x_i x_j \frac{n(n-1)!}{x_i x_j (x_i-1)!(x_j-1)!} \Bigr) \frac{p_1^{x_1}\cdots p_k^{x_k}} {x_1!\cdots x_{i-1}!\,(x_i-1)!\,x_{i+1}!\cdots x_{j-1}!\,(x_j-1)!\,\dots x_k!}\\[6pt] &=\color{blue}{n(n-1)\,p_i\,p_j} \sum_{\sum x_r=n} \frac{(n-1)!}{x_1!\cdots(x_i-1)!\cdots(x_j-1)!\cdots x_k!}\; p_1^{x_1}\cdots p_i^{x_i-1}\cdots p_j^{x_j-1}\cdots p_k^{x_k} \end{aligned} \]

変換

\(w_i=x_i-1,\;w_j=x_j-1,\;w_r=x_r\ (r\neq i,j)\) で

\[ w_1+\dots+w_k =(n-2) \]

総和=1 なので

\[ \boxed{E[X_iX_j]=n(n-1)\,p_i\,p_j} \]

4.2. 共分散を計算

\[ \begin{aligned} \mathrm{Cov}(X_i,X_j) &=E[X_iX_j] – E[X_i]\,E[X_j]\\[4pt] &=n(n-1)p_i p_j – (np_i)(np_j)\\[4pt] &=-\,n\,p_i\,p_j\\ \end{aligned} \]

\[ \boxed{\displaystyle\mathrm{Cov}(X_i,X_j)=-\,n\,p_i\,p_j\quad(i\neq j)} \]