Bayesian Networksのd-separation
Bayesian Networks(ベイジアンネットワーク)のd-separation(分離)について解説します。
1. 1.d-separationとは?
d-separationはベイジアンネットワーク内の変数の条件付き独立を判断するための方法である。d-separationには、以下の3種類がある。
2. 2.d-separationの種類
以下の条件を満たす経路であるとき、条件付き独立である。
2.1. 2.1chain
chain、連鎖とは、Yが観測済みであるとき、3つのノードX、Y、Zが直列に接続されている経路であり、条件付き独立である。
2.2. 2.2fork(tent)
tentはYが観測済みであるとき、ノードX、Zが以下のような分岐経路であり、条件付き独立である。
2.3. 2.3v-structure
v-structureは、ノードYが観測済みでないとき、ノードX、Y、Zが以下のような経路であり、独立である。
3. 3.d-separtationの証明
3.1. 3.1chainの証明
$X,Y,Z$の同時確率を求める。
$P(X,Y,Z)=P(X)P(Y|X)P(Z|Y)$
次に、$Y$ $given$のとき、$P(X,Z|Y)$は以下のようになる。
$P(X,Z|Y)=\dfrac{P(X,Y,Z)}{P(Y)}$
$=\dfrac{P(X)P(Y|X)P(Z|Y)}{P(Y)}$
$=\dfrac{P(Y,X)P(Z|Y)}{P(Y)}$
$P(X|Y)=\dfrac{P(X,Y)}{P(Y)}$より、
$P(X,Z|Y)=P(X|Y)P(Z|Y)$
となる。したがって、chainは条件付き独立を満たしていることを確認できる。
3.2. 3.2fork(tent)の証明
$X,Y,Z$の同時確率を求める。
$P(X,Y,Z)=P(Y)P(X|Y)P(Z|Y)$
次に、$Y$ $given$のとき、$P(X,Z|Y)$は以下のようになる。
$P(X,Z|Y)=\dfrac{P(X,Y,Z)}{P(Y)}$
$=\dfrac{P(Y)P(X|Y)P(Z|Y)}{P(Y)}$
$=P(X|Y)P(Z|Y)$
となる。したがって、fork(tent)は条件付き独立を満たしていることを確認できる。
3.3. 3.3v-structureの証明
$X,Y,Z$の同時確率を求める。
$P(X,Y,Z)=P(X)P(Z)P(Y|X,Z)$
次に、$Y$ $given$であるとき、$P(X,Z|Y)$は以下のようになる。
$P(X,Z|Y)=\dfrac{P(X,Y,Z)}{P(Y)}$
$=\dfrac{P(X)P(Z)P(Y|X,Z)}{P(Y)}$
となる。$Y$ $given$であるときは、条件付き独立ではないことがわかる。
一方、$Y$ $given$ではないとき、$P(X,Z)$を求める。Yは観測済みではないから、同時確率をYに関して周辺化を行うと$P(X,Z)$になるため、
$P(X,Z)=\displaystyle\sum_{Y} P(X,Y,Z)$
$=\displaystyle\sum_{Y} P(X)P(Z)P(Y|X,Z)$
$=P(X)P(Z)$
したがって、$Y$ $given$でないとき、独立であることを確認できる。