更新:2025/02/26

Berry–Esseenの不等式(定理)の意味について

はるか
はるか
ベリー=エシーンの定理、中心極限定理の精度を評価するもの。
ふゅか
ふゅか
そうね!中心極限定理が「たくさんのデータがあると標準正規分布に近づく」って話だったけど、その精度を教えてくれるのがベリー=エシーンの定理なのよ!

1. ベリー=エシーンの定理 (Berry–Esseen theorem) とは?

ベリー=エシーンの定理は、中心極限定理 (CLT: Central Limit Theorem) に関する精度を定量的に示す定理です。

1.1. 背景

中心極限定理 (CLT) 中心極限定理によれば、独立で同分布 (i.i.d.) の確率変数 X1,X2,,Xn X_1, X_2, \dots, X_n の和が適切に標準化されると、 n n \to \infty のとき標準正規分布 N(0,1) \mathcal{N}(0,1) に分布収束します。

具体的に、各確率変数 Xi X_i の期待値 E[Xi]=μ \mathbb{E}[X_i] = \mu 、分散 Var(Xi)=σ2 \text{Var}(X_i) = \sigma^2 が存在する場合、

Sn=1ni=1n(Xiμ) S_n = \frac{1}{\sqrt{n}} \sum_{i=1}^{n} (X_i - \mu)

は標準正規分布に収束します。

しかし、中心極限定理の精度そのものでは明示されません。

2. 定理の定式化

独立な確率変数 X1,X2,,Xn X_1, X_2, \dots, X_n があり、それぞれの期待値 E[Xi]=μ \mathbb{E}[X_i] = \mu、分散 Var(Xi)=σ2 \text{Var}(X_i) =\sigma ^2 となるとします。また、このとき、確率変数SnS_n

Sn=1σnj=1n(Xjμ))S_n =\frac{1}{\sigma \sqrt{n}}\sum_{j=1}^{n}(X_j-\mu))

Φ(x)\Phi(x)を標準正規分布の累積分布関数とすると、中心極限定理の精度の評価は次のようにされます。

supxRP(Snx)Φ(x)Cρin \sup_{x \in \mathbb{R}} \left| P(S_n \leq x) - \Phi(x) \right| \leq \frac{C\rho_i}{\sqrt{n}}

ここで C C は、一般に

0.4049C0.7975 0.4049 \leq C \leq 0.7975

が知られています。

PR