更新:2025/03/11

ベータ分布の意味と期待値・分散の導出について

「0から1の間で、特定の範囲にデータが集まりやすい確率分布はないのか?」

確率論や統計学に興味を持ち始めたとき、多くの人がこの疑問を抱きます。

例えば、ある製品の不良率や、A/Bテストの成功確率を考える際に登場するのが ベータ分布 です。

はるか
はるか
確率分布で0から1の間に収まるものって何がある?
ふゅか
ふゅか
うーん、いろいろあるけど、代表的なのはベータ分布かな!形を変えやすいから、いろんな場面で使われるよ!
はるか
はるか
形を変えやすい?
ふゅか
ふゅか
そう!ベータ分布はパラメータ α\alphaβ\beta を変えることで、左右に偏ったり、真ん中に集中したりするんだ!例えば、A/Bテストで成功確率を予測するときに使われるよ。

1. ベータ分布とは

ベータ分布は、区間 [0,1][0,1] 上で定義される確率分布です。確率密度関数 (PDF) は、以下の式で与えられます:

Beta(xα,β)=xα1(1x)β1B(α,β),0x1 \text{Beta}(x \mid \alpha, \beta) = \frac{x^{\alpha - 1} (1 - x)^{\beta - 1}}{\mathrm{B}(\alpha, \beta)}, \quad 0 \le x \le 1

ベータ分布のグラフ

 

ここで、α>0\alpha > 0β>0\beta > 0 は形状パラメータ (shape parameters) であり、B(α,β)\mathrm{B}(\alpha, \beta)ベータ関数です。ベータ関数 B(α,β)\mathrm{B}(\alpha, \beta) は以下のように定義されます。

B(α,β)=01tα1(1t)β1dt=Γ(α)Γ(β)Γ(α+β) \mathrm{B}(\alpha, \beta) = \int_0^1 t^{\alpha - 1} (1-t)^{\beta - 1} \, dt = \frac{\Gamma(\alpha)\,\Gamma(\beta)}{\Gamma(\alpha + \beta)}

Γ()\Gamma(\cdot)ガンマ関数です。

2. 期待値・分散

ベータ分布の期待値 (mean) と分散 (variance) は、それぞれ以下のように表せます。

期待値: E[X]=αα+β E[X] = \frac{\alpha}{\alpha + \beta}

分散: Var(X)=αβ(α+β)2(α+β+1) \mathrm{Var}(X) = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)}

これらの式から、α\alphaβ\beta の比によって分布の中心や広がりが決まることがわかります。

2.1. 期待値の導出

期待値 E[X]E[X] は、次の積分で求めます:

E[X]=01xf(x)dx E[X] = \int_0^1 x f(x) \, dx

PDF を代入すると、

E[X]=01xxα1(1x)β1B(α,β)dx E[X] = \int_0^1 x \cdot \frac{x^{\alpha - 1} (1 - x)^{\beta - 1}}{\mathrm{B}(\alpha, \beta)} \, dx

=1B(α,β)01xα(1x)β1dx = \frac{1}{\mathrm{B}(\alpha, \beta)} \int_0^1 x^{\alpha} (1 - x)^{\beta - 1} \, dx

ここで、ベータ関数の性質

01tm1(1t)n1dt=B(m,n)=Γ(m)Γ(n)Γ(m+n) \int_0^1 t^{m-1} (1 - t)^{n-1} \, dt = \mathrm{B}(m, n) = \frac{\Gamma(m) \Gamma(n)}{\Gamma(m+n)}

を利用すると、上の積分部分はベータ関数 B(α+1,β)\mathrm{B}(\alpha+1, \beta) に対応します:

E[X]=B(α+1,β)B(α,β) E[X] = \frac{\mathrm{B}(\alpha + 1, \beta)}{\mathrm{B}(\alpha, \beta)}

B(α,β)\mathrm{B}(\alpha, \beta) のガンマ関数表示を使って変形すると、

B(α+1,β)=Γ(α+1)Γ(β)Γ(α+β+1) \mathrm{B}(\alpha + 1, \beta) = \frac{\Gamma(\alpha + 1) \Gamma(\beta)}{\Gamma(\alpha + \beta + 1)}

B(α,β)=Γ(α)Γ(β)Γ(α+β) \mathrm{B}(\alpha, \beta) = \frac{\Gamma(\alpha) \Gamma(\beta)}{\Gamma(\alpha + \beta)}

これらの比をとると、

E[X]=Γ(α+1)Γ(β)Γ(α+β)Γ(α)Γ(β)Γ(α+β+1) E[X] = \frac{\Gamma(\alpha + 1) \Gamma(\beta) \Gamma(\alpha + \beta)}{\Gamma(\alpha) \Gamma(\beta) \Gamma(\alpha + \beta + 1)}

ここで、ガンマ関数の性質 Γ(z+1)=zΓ(z)\Gamma(z+1) = z\Gamma(z) を使うと、

Γ(α+1)=αΓ(α) \Gamma(\alpha + 1) = \alpha \Gamma(\alpha)

を代入して、

E[X]=αΓ(α)Γ(β)Γ(α+β)Γ(α)Γ(β)(α+β)Γ(α+β) E[X] = \frac{\alpha \Gamma(\alpha) \Gamma(\beta) \Gamma(\alpha + \beta)}{\Gamma(\alpha) \Gamma(\beta) (\alpha + \beta) \Gamma(\alpha + \beta)}

Γ(α)\Gamma(\alpha), Γ(β)\Gamma(\beta), Γ(α+β)\Gamma(\alpha + \beta) を約分すると、

E[X]=αα+β E[X] = \frac{\alpha}{\alpha + \beta}

2.2. 分散の導出

分散 Var(X)\text{Var}(X) は、次の式で求めます。

Var(X)=E[X2](E[X])2 \text{Var}(X) = E[X^2] - (E[X])^2

まず、E[X2]E[X^2] を求めます。

E[X2]=01x2f(x)dx E[X^2] = \int_0^1 x^2 f(x) \, dx

=01x2xα1(1x)β1B(α,β)dx = \int_0^1 x^2 \cdot \frac{x^{\alpha - 1} (1 - x)^{\beta - 1}}{\mathrm{B}(\alpha, \beta)} \, dx

=1B(α,β)01xα+11(1x)β1dx = \frac{1}{\mathrm{B}(\alpha, \beta)} \int_0^1 x^{\alpha+1 - 1} (1 - x)^{\beta - 1} \, dx

ここで、ベータ関数の性質を再び利用すると、この積分は B(α+2,β)\mathrm{B}(\alpha+2, \beta) に等しくなります。

E[X2]=B(α+2,β)B(α,β) E[X^2] = \frac{\mathrm{B}(\alpha + 2, \beta)}{\mathrm{B}(\alpha, \beta)}

B(α+2,β)\mathrm{B}(\alpha+2, \beta) をガンマ関数で表すと、

B(α+2,β)=Γ(α+2)Γ(β)Γ(α+β+2) \mathrm{B}(\alpha+2, \beta) = \frac{\Gamma(\alpha+2) \Gamma(\beta)}{\Gamma(\alpha+\beta+2)}

また、Γ(α+2)\Gamma(\alpha+2) の性質を用いて、

Γ(α+2)=(α+1)αΓ(α) \Gamma(\alpha+2) = (\alpha+1)\alpha\Gamma(\alpha)

を代入すると、

E[X2]=(α+1)αΓ(α)Γ(β)Γ(α+β)Γ(α)Γ(β)(α+β)(α+β+1)Γ(α+β) E[X^2] = \frac{(\alpha+1)\alpha \Gamma(\alpha) \Gamma(\beta) \Gamma(\alpha+\beta)}{\Gamma(\alpha) \Gamma(\beta) (\alpha+\beta)(\alpha+\beta+1) \Gamma(\alpha+\beta)}

約分して、

E[X2]=α(α+1)(α+β)(α+β+1) E[X^2] = \frac{\alpha(\alpha+1)}{(\alpha+\beta)(\alpha+\beta+1)}

分散は

Var(X)=E[X2](E[X])2 \text{Var}(X) = E[X^2] - (E[X])^2

=α(α+1)(α+β)(α+β+1)(αα+β)2 = \frac{\alpha(\alpha+1)}{(\alpha+\beta)(\alpha+\beta+1)} - \left(\frac{\alpha}{\alpha+\beta}\right)^2

通分して整理すると、

Var(X)=αβ(α+β)2(α+β+1) \text{Var}(X) = \frac{\alpha\beta}{(\alpha+\beta)^2 (\alpha+\beta+1)}

3. 期待値とディガンマ関数

E[lnX]  =  ψ(α)    ψ(α+β) E[\ln X] \;=\; \psi(\alpha) \;-\; \psi(\alpha + \beta)

ここで、ψ() \psi(\cdot) ディガンマ関数 (digamma function) を表します。

はるか
はるか
ディガンマ関数って何?
ふゅか
ふゅか
ガンマ関数の微分だよ! ψ(x)=ddxlnΓ(x)\psi(x) = \frac{d}{dx} \ln \Gamma(x) って表されるの。

3.1. 積分表示

期待値 E[lnX] E[\ln X] は定義より

E[lnX]=01ln(x)f(x)dx=1B(α,β)01ln(x)xα1(1x)β1dx E[\ln X] = \int_{0}^{1} \ln(x)\, f(x)\, dx = \frac{1}{B(\alpha, \beta)} \int_{0}^{1} \ln(x)\, x^{\alpha - 1} (1 - x)^{\beta - 1}\, dx

と書けます。

3.2. ベータ関数の微分

ベータ関数 B(p,q) B(p,q) の定義

B(p,q)=01xp1(1x)q1dx B(p,q) = \int_{0}^{1} x^{p - 1} (1 - x)^{q - 1}\, dx

を用いて、変数 pp に関する微分を考えます。

pB(p,q)=p01xp1(1x)q1dx=01p[xp1(1x)q1]dx \frac{\partial}{\partial p} B(p,q) = \frac{\partial}{\partial p} \int_{0}^{1} x^{p - 1} (1 - x)^{q - 1}\, dx = \int_{0}^{1} \frac{\partial}{\partial p} \bigl[x^{p - 1} (1 - x)^{q - 1}\bigr] dx

xp1 x^{p - 1} p p で微分すると xp1ln(x) x^{p-1} \ln(x) が出るため、結局

pB(p,q)=01xp1(1x)q1ln(x)dx \frac{\partial}{\partial p} B(p,q) = \int_{0}^{1} x^{p - 1} (1 - x)^{q - 1} \ln(x)\, dx

となります。これより、

01xp1(1x)q1ln(x)dx=pB(p,q) \int_{0}^{1} x^{p - 1} (1 - x)^{q - 1} \ln(x)\, dx = \frac{\partial}{\partial p} B(p,q)

3.3. 元の期待値への応用

先ほどの期待値に戻ると、

E[lnX]=1B(α,β)01ln(x)xα1(1x)β1dx=1B(α,β)αB(α,β) E[\ln X] = \frac{1}{B(\alpha, \beta)} \int_{0}^{1} \ln(x)\, x^{\alpha - 1} (1 - x)^{\beta - 1}\, dx = \frac{1}{B(\alpha, \beta)} \frac{\partial}{\partial \alpha} B(\alpha, \beta)

したがって、あとは B(α,β) B(\alpha,\beta) α\alpha に関する微分を計算すればよいわけです。

3.4. ベータ関数とガンマ関数の関係

B(α,β)=Γ(α)Γ(β)Γ(α+β) B(\alpha,\beta) = \frac{\Gamma(\alpha)\,\Gamma(\beta)}{\Gamma(\alpha + \beta)}

両辺の対数をとると

lnB(α,β)=lnΓ(α)+lnΓ(β)lnΓ(α+β) \ln B(\alpha, \beta) = \ln \Gamma(\alpha)+\ln \Gamma(\beta)-\ln \Gamma(\alpha + \beta)

α\alpha で微分すると、

αlnB(α,β)=αlnΓ(α)+0αlnΓ(α+β)=ψ(α)ψ(α+β) \frac{\partial}{\partial \alpha} \ln B(\alpha, \beta) = \frac{\partial}{\partial \alpha} \ln \Gamma(\alpha)+0-\frac{\partial}{\partial \alpha} \ln \Gamma(\alpha + \beta) = \psi(\alpha) - \psi(\alpha + \beta)

となります。ここで、ψ(x)=ddxlnΓ(x) \psi(x) = \frac{d}{dx}\ln\Gamma(x) はディガンマ関数です。さらに、両辺に B(α,β) B(\alpha, \beta) をかけてやると、

αB(α,β)=B(α,β)[ψ(α)ψ(α+β)] \frac{\partial}{\partial \alpha} B(\alpha, \beta) = B(\alpha, \beta)\,\bigl[\psi(\alpha) - \psi(\alpha + \beta)\bigr]

3.5. 最終式

以上より、

E[lnX]=1B(α,β)αB(α,β)=1B(α,β)B(α,β)[ψ(α)ψ(α+β)]=ψ(α)ψ(α+β) E[\ln X] = \frac{1}{B(\alpha, \beta)} \frac{\partial}{\partial \alpha} B(\alpha, \beta) = \frac{1}{B(\alpha, \beta)} \cdot B(\alpha, \beta)\,\bigl[\psi(\alpha) - \psi(\alpha + \beta)\bigr] = \psi(\alpha) - \psi(\alpha + \beta)

したがって

E[lnX]  =  ψ(α)    ψ(α+β) \boxed{ E[\ln X] \;=\; \psi(\alpha) \;-\; \psi(\alpha + \beta) }

PR