はるか
ふゅか
そうね!不偏分散は、その点で違うのよ。サンプルデータから母集団の分散を推定するために、不偏分散を使うの。
1. 標本分散とは
標本分散
S2は次のように定義される。
S2=n1i=1∑n(xi−xˉ)2
標本分散は母分散の不偏推定量ではないです。
- n はサンプルの大きさ(データの個数)
- xi は各データの値
- xˉ はサンプルの平均(標本平均)
2. 不偏分散とは
不偏分散は、サンプルデータから母集団の分散を推定するときに使用されます。
不偏分散の定義は次のようになります。
s2=n−11i=1∑n(xi−xˉ)2
- n はサンプルの大きさ(データの個数)
- xi は各データの値
- xˉ はサンプルの平均(標本平均)
3. 不偏分散の性質
3.1. 母分散の不偏推定量
不偏分散
σ^2は母分散
σ2の
不偏推定量である。
E[σ^2]=σ2
まず、母分散 σ2 は以下の式で定義されます。
σ2=E[(X−μ)2]
ここで、μ=E[X] は母平均、E は期待値を表しています。
標本分散は次の式で定義されます。
S2=n1i=1∑n(Xi−Xˉ)2
ここで、Xˉ=n1∑i=1nXi は標本平均、Xi は観測値、n は標本数(サンプル数)です。
不偏分散は次の式で定義されます。
σ^2=n−11i=1∑n(Xi−Xˉ)2
不偏分散が母分散の不偏推定量であるとは、期待値 E[σ^2]=σ2 であることを示すことです。
まず、標本平均 Xˉ の性質を考えます。
Xˉ=n1i=1∑nXi
標本平均 Xˉ の期待値は母平均に等しいことが知られています。
E[Xˉ]=μ
次に、∑i=1n(Xi−Xˉ)2 の期待値を計算します。このために、標本分散の式を展開します。
i=1∑n(Xi−Xˉ)2=i=1∑n((Xi−μ)−(Xˉ−μ))2
これを展開すると、次の3つの項に分けられます。
=i=1∑n(Xi−μ)2−2(Xˉ−μ)i=1∑n(Xi−μ)+n(Xˉ−μ)2
ここで、∑i=1n(Xi−μ)=n(Xˉ−μ) であるため、
i=1∑n(Xi−Xˉ)2=i=1∑n(Xi−μ)2−n(Xˉ−μ)2
期待値を取ると、E[(Xi−μ)2]=σ2 なので、
E[i=1∑n(Xi−Xˉ)2]=nσ2−E[n(Xˉ−μ)2]
標本平均の分散は V(Xˉ)=nσ2 なので、
E[(Xˉ−μ)2]=V(Xˉ)=nσ2
これを用いると、
E[i=1∑n(Xi−Xˉ)2]=nσ2−n⋅nσ2=(n−1)σ2
したがって、不偏分散 σ^2 の期待値は、
E[σ^2]=n−11E[i=1∑n(Xi−Xˉ)2]=n−11⋅(n−1)σ2=σ2
これにより、不偏分散は母分散の不偏推定量であることが示されました。
4. 例題
ふゅか
じゃあ、具体的に例を使って説明してみるね。例えば、プロジェクトの収益を考えるよ。
はるか
うん、収益データを使う。A: 150, B: 200, C: 250, D: 300, E: 350。
4.1. 例題1:プロジェクトの収益
ある会社が以下の5つのプロジェクトからの収益を記録しました。それぞれの収益は次の通りです(単位は万円)。
- プロジェクトA: 150
- プロジェクトB: 200
- プロジェクトC: 250
- プロジェクトD: 300
- プロジェクトE: 350
この5つのプロジェクトから得られた収益の不偏分散を計算してください。
収益のデータをすべて足して平均を求めます。
平均 xˉ は次の式で計算されます。
xˉ=5150+200+250+300+350=51250=250
各プロジェクトの収益から平均を引いて偏差を計算します。
- プロジェクトA: 150−250=−100
- プロジェクトB: 200−250=−50
- プロジェクトC: 250−250=0
- プロジェクトD: 300−250=50
- プロジェクトE: 350−250=100
各偏差を二乗します。
- プロジェクトA: (−100)2=10000
- プロジェクトB: (−50)2=2500
- プロジェクトC: 02=0
- プロジェクトD: 502=2500
- プロジェクトE: 1002=10000
二乗した偏差を合計します。
10000+2500+0+2500+10000=25000
不偏分散は次の式で計算されます。
s2=n−11i=1∑n(xi−xˉ)2
ここで、n=5 ですから、
s2=5−125000=425000=6250
この会社のプロジェクト収益の不偏分散は 6250万円2です。
4.2. 例題2:魔法の成功回数
ある魔法学校の生徒たちは、試験で以下の5種類の魔法を使用してみました。それぞれの魔法を成功させた回数(単位は回数)は次の通りです:
- 魔法A(火の魔法): 10回
- 魔法B(水の魔法): 15回
- 魔法C(風の魔法): 20回
- 魔法D(土の魔法): 25回
- 魔法E(光の魔法): 30回
この5種類の魔法の成功回数の不偏分散を計算してください。
成功回数のデータをすべて足して平均を求めます。
平均 xˉ は次の式で計算されます。
xˉ=510+15+20+25+30=5100=20
各魔法の成功回数から平均を引いて偏差を計算します。
- 魔法A: 10−20=−10
- 魔法B: 15−20=−5
- 魔法C: 20−20=0
- 魔法D: 25−20=5
- 魔法E: 30−20=10
各偏差を二乗します。
- 魔法A: (−10)2=100
- 魔法B: (−5)2=25
- 魔法C: 02=0
- 魔法D: 52=25
- 魔法E: 102=100
二乗した偏差を合計します。
100+25+0+25+100=250
不偏分散は次の式で計算されます。
s2=n−11i=1∑n(xi−xˉ)2
ここで、n=5 ですから、
s2=5−1250=4250=62.5
魔法の成功回数の不偏分散は62.5回2 です。