Bayesian Networksのd-separation

Bayesian Networks(ベイジアンネットワーク)のd-separation(分離)について解説します。

1. 1.d-separationとは?

d-separationはベイジアンネットワーク内の変数の条件付き独立を判断するための方法である。d-separationには、以下の3種類がある。

2. 2.d-separationの種類

以下の条件を満たす経路であるとき、条件付き独立である。

2.1. 2.1chain

chain、連鎖とは、Yが観測済みであるとき、3つのノードX、Y、Zが直列に接続されている経路であり、条件付き独立である。

2.2. 2.2fork(tent)

tentはYが観測済みであるとき、ノードX、Zが以下のような分岐経路であり、条件付き独立である。

2.3. 2.3v-structure

v-structureは、ノードYが観測済みでないとき、ノードX、Y、Zが以下のような経路であり、独立である。

3. 3.d-separtationの証明

3.1. 3.1chainの証明


$X,Y,Z$の同時確率を求める。

$P(X,Y,Z)=P(X)P(Y|X)P(Z|Y)$

次に、$Y$ $given$のとき、$P(X,Z|Y)$は以下のようになる。

$P(X,Z|Y)=\dfrac{P(X,Y,Z)}{P(Y)}$

$=\dfrac{P(X)P(Y|X)P(Z|Y)}{P(Y)}$

$=\dfrac{P(Y,X)P(Z|Y)}{P(Y)}$

$P(X|Y)=\dfrac{P(X,Y)}{P(Y)}$より、

$P(X,Z|Y)=P(X|Y)P(Z|Y)$

となる。したがって、chainは条件付き独立を満たしていることを確認できる。

3.2. 3.2fork(tent)の証明

$X,Y,Z$の同時確率を求める。

$P(X,Y,Z)=P(Y)P(X|Y)P(Z|Y)$

次に、$Y$ $given$のとき、$P(X,Z|Y)$は以下のようになる。

$P(X,Z|Y)=\dfrac{P(X,Y,Z)}{P(Y)}$

$=\dfrac{P(Y)P(X|Y)P(Z|Y)}{P(Y)}$

$=P(X|Y)P(Z|Y)$

となる。したがって、fork(tent)は条件付き独立を満たしていることを確認できる。

3.3. 3.3v-structureの証明

$X,Y,Z$の同時確率を求める。

$P(X,Y,Z)=P(X)P(Z)P(Y|X,Z)$

次に、$Y$ $given$であるとき、$P(X,Z|Y)$は以下のようになる。

$P(X,Z|Y)=\dfrac{P(X,Y,Z)}{P(Y)}$

$=\dfrac{P(X)P(Z)P(Y|X,Z)}{P(Y)}$

となる。$Y$ $given$であるときは、条件付き独立ではないことがわかる。

一方、$Y$ $given$ではないとき、$P(X,Z)$を求める。Yは観測済みではないから、同時確率をYに関して周辺化を行うと$P(X,Z)$になるため、

$P(X,Z)=\displaystyle\sum_{Y} P(X,Y,Z)$

$=\displaystyle\sum_{Y} P(X)P(Z)P(Y|X,Z)$

$=P(X)P(Z)$

したがって、$Y$ $given$でないとき、独立であることを確認できる。

PR