更新:2024/09/14

分散共分散行列の定義・例題について

ふゅか
ふゅか
ふゅか、分散共分散行列って知ってる?ちょっと難しそうに聞こえるけど、簡単に言えば、データの変数間の関係を表すものなのよ!
はるか
はるか
うん、データの各変数間の分散と共分散をまとめた行列。

1. 分散共分散行列とは

分散共分散行列は、多次元データの各変数間の分散と共分散を表す行列です。分散共分散行列 \( \Sigma \) は対称行列で、次のような形をしています。

\[ \Sigma = \begin{pmatrix} \mathbb{V}[X_1] & \text{Cov}(X_1, X_2) & \cdots & \text{Cov}(X_1, X_p) \\ \text{Cov}(X_2, X_1) & \mathbb{V}[X_2] & \cdots & \text{Cov}(X_2, X_p) \\ \vdots & \vdots & \ddots & \vdots \\ \text{Cov}(X_p, X_1) & \text{Cov}(X_p, X_2) & \cdots & \mathbb{V}[X_p] \end{pmatrix} \]

ここで

  • \(\mathbb{V}[X_i]\) は変数 \( X_i \) の分散。
  • \(\text{Cov}(X_i, X_j)\) は変数 \( X_i \) と \( X_j \) の共分散。
  • $p\times p$の対称行列

\( X_i \) と \( X_j \) の共分散は次のようになります。

$$\text{Cov}(X_i, X_j)=\mathbb{E}[(X_i-\mathbb{E}[X_i])(X_j-\mathbb{E}[X_j])]$$

この行列の対角成分は各変数の分散を、非対角成分は各変数間の共分散を表しています。

2. 例題

ある2つの変数 \( X \) と \( Y \) が以下のように与えられています。これらのデータをもとに、分散共分散行列を求めてください。
サンプル番号 \( X \) \( Y \)
1 2 4
2 4 2
3 6 8
4 8 6
はるか
はるか
例えば、2次元のXとYのデータから分散共分散行列を求めてみる。
ふゅか
ふゅか
XとYの平均をまず計算して、それぞれのサンプルから平均を引いた偏差を求めるの。それから分散と共分散を計算して、行列を作ろう!

平均の計算\( X \) と \( Y \) の平均を求めます。

\[ \bar{X} = \frac{2 + 4 + 6 + 8}{4} = 5 \] \[ \bar{Y} = \frac{4 + 2 + 8 + 6}{4} = 5 \]

偏差の計算各サンプルの偏差を計算します。

\[ X_i – \bar{X} = \{-3, -1, 1, 3\} \]

\[ Y_i – \bar{Y} = \{-1, -3, 3, 1\} \]

分散と共分散の計算\( X \) の分散、\( Y \) の分散、そして \( X \) と \( Y \) の共分散を求めます。

\[ \mathbb{V}(X) = \frac{(-3)^2 + (-1)^2 + 1^2 + 3^2}{4} = \frac{20}{4} = 5 \]

\[ \mathbb{V}(Y) = \frac{(-1)^2 + (-3)^2 + 3^2 + 1^2}{4} = \frac{20}{4} = 5 \]

\[ \text{Cov}(X, Y) = \frac{(-3)(-1) + (-1)(-3) + 1 \times 3 + 3 \times 1}{4} = \frac{14}{4} = 3.5 \]

分散共分散行列の作成分散共分散行列は次のように表されます。

\[ \Sigma = \begin{bmatrix} \mathbb{V}(X) & \text{Cov}(X, Y) \\ \text{Cov}(Y, X) & \mathbb{V}(Y) \end{bmatrix} = \begin{bmatrix} 5 & 3.5 \\ 3.5 & 5 \end{bmatrix} \]

これで、与えられたデータに基づく分散共分散行列が求められました。

PR