「0から1の間で、特定の範囲にデータが集まりやすい確率分布はないのか?」
確率論や統計学に興味を持ち始めたとき、多くの人がこの疑問を抱きます。
例えば、ある製品の不良率や、A/Bテストの成功確率を考える際に登場するのが ベータ分布 です。
はるか
ふゅか
うーん、いろいろあるけど、代表的なのはベータ分布かな!形を変えやすいから、いろんな場面で使われるよ!
はるか
ふゅか
そう!ベータ分布はパラメータ
α と
β を変えることで、左右に偏ったり、真ん中に集中したりするんだ!例えば、A/Bテストで成功確率を予測するときに使われるよ。
1. ベータ分布とは
ベータ分布は、区間 [0,1] 上で定義される確率分布です。確率密度関数 (PDF) は、以下の式で与えられます:
Beta(x∣α,β)=B(α,β)xα−1(1−x)β−1,0≤x≤1

ここで、α>0 と β>0 は形状パラメータ (shape parameters) であり、B(α,β) はベータ関数です。ベータ関数 B(α,β) は以下のように定義されます。
B(α,β)=∫01tα−1(1−t)β−1dt=Γ(α+β)Γ(α)Γ(β)
Γ(⋅) はガンマ関数です。
2. 期待値・分散
ベータ分布の期待値 (mean) と分散 (variance) は、それぞれ以下のように表せます。
期待値: E[X]=α+βα
分散: Var(X)=(α+β)2(α+β+1)αβ
これらの式から、α と β の比によって分布の中心や広がりが決まることがわかります。
2.1. 期待値の導出
期待値 E[X] は、次の積分で求めます:
E[X]=∫01xf(x)dx
PDF を代入すると、
E[X]=∫01x⋅B(α,β)xα−1(1−x)β−1dx
=B(α,β)1∫01xα(1−x)β−1dx
ここで、ベータ関数の性質
∫01tm−1(1−t)n−1dt=B(m,n)=Γ(m+n)Γ(m)Γ(n)
を利用すると、上の積分部分はベータ関数 B(α+1,β) に対応します:
E[X]=B(α,β)B(α+1,β)
B(α,β) のガンマ関数表示を使って変形すると、
B(α+1,β)=Γ(α+β+1)Γ(α+1)Γ(β)
B(α,β)=Γ(α+β)Γ(α)Γ(β)
これらの比をとると、
E[X]=Γ(α)Γ(β)Γ(α+β+1)Γ(α+1)Γ(β)Γ(α+β)
ここで、ガンマ関数の性質 Γ(z+1)=zΓ(z) を使うと、
Γ(α+1)=αΓ(α)
を代入して、
E[X]=Γ(α)Γ(β)(α+β)Γ(α+β)αΓ(α)Γ(β)Γ(α+β)
Γ(α), Γ(β), Γ(α+β) を約分すると、
E[X]=α+βα
2.2. 分散の導出
分散 Var(X) は、次の式で求めます。
Var(X)=E[X2]−(E[X])2
まず、E[X2] を求めます。
E[X2]=∫01x2f(x)dx
=∫01x2⋅B(α,β)xα−1(1−x)β−1dx
=B(α,β)1∫01xα+1−1(1−x)β−1dx
ここで、ベータ関数の性質を再び利用すると、この積分は B(α+2,β) に等しくなります。
E[X2]=B(α,β)B(α+2,β)
B(α+2,β) をガンマ関数で表すと、
B(α+2,β)=Γ(α+β+2)Γ(α+2)Γ(β)
また、Γ(α+2) の性質を用いて、
Γ(α+2)=(α+1)αΓ(α)
を代入すると、
E[X2]=Γ(α)Γ(β)(α+β)(α+β+1)Γ(α+β)(α+1)αΓ(α)Γ(β)Γ(α+β)
約分して、
E[X2]=(α+β)(α+β+1)α(α+1)
分散は
Var(X)=E[X2]−(E[X])2
=(α+β)(α+β+1)α(α+1)−(α+βα)2
通分して整理すると、
Var(X)=(α+β)2(α+β+1)αβ
3. 期待値とディガンマ関数
E[lnX]=ψ(α)−ψ(α+β)
ここで、ψ(⋅) は ディガンマ関数 (digamma function) を表します。
はるか
ふゅか
ガンマ関数の微分だよ!
ψ(x)=dxdlnΓ(x) って表されるの。
3.1. 積分表示
期待値 E[lnX] は定義より
E[lnX]=∫01ln(x)f(x)dx=B(α,β)1∫01ln(x)xα−1(1−x)β−1dx
と書けます。
3.2. ベータ関数の微分
ベータ関数 B(p,q) の定義
B(p,q)=∫01xp−1(1−x)q−1dx
を用いて、変数 p に関する微分を考えます。
∂p∂B(p,q)=∂p∂∫01xp−1(1−x)q−1dx=∫01∂p∂[xp−1(1−x)q−1]dx
xp−1 を p で微分すると xp−1ln(x) が出るため、結局
∂p∂B(p,q)=∫01xp−1(1−x)q−1ln(x)dx
となります。これより、
∫01xp−1(1−x)q−1ln(x)dx=∂p∂B(p,q)
3.3. 元の期待値への応用
先ほどの期待値に戻ると、
E[lnX]=B(α,β)1∫01ln(x)xα−1(1−x)β−1dx=B(α,β)1∂α∂B(α,β)
したがって、あとは B(α,β) の α に関する微分を計算すればよいわけです。
3.4. ベータ関数とガンマ関数の関係
B(α,β)=Γ(α+β)Γ(α)Γ(β)
両辺の対数をとると
lnB(α,β)=lnΓ(α)+lnΓ(β)−lnΓ(α+β)
α で微分すると、
∂α∂lnB(α,β)=∂α∂lnΓ(α)+0−∂α∂lnΓ(α+β)=ψ(α)−ψ(α+β)
となります。ここで、ψ(x)=dxdlnΓ(x) はディガンマ関数です。さらに、両辺に B(α,β) をかけてやると、
∂α∂B(α,β)=B(α,β)[ψ(α)−ψ(α+β)]
3.5. 最終式
以上より、
E[lnX]=B(α,β)1∂α∂B(α,β)=B(α,β)1⋅B(α,β)[ψ(α)−ψ(α+β)]=ψ(α)−ψ(α+β)
したがって
E[lnX]=ψ(α)−ψ(α+β)