Bradley–Terry modelの意味と例題、ロジスティック回帰について



1. Bradley–Terry model
Bradley–Terryモデルは、ペア比較の結果を予測するために使用される確率モデルで、ランキングやレーティングシステムでよく使われます。スポーツや競技、などの勝敗を予測する際に利用されます。
$$p_{st}=\dfrac{\pi_S}{\pi_S+\pi_T}$$
ただし引き分けは考えないものとする。
逆に、TチームがSチームに勝つ確率$p_{ts}$は
$$ p_{ts} = 1-\dfrac{\pi_S}{\pi_S+\pi_T} = \dfrac{\pi_T}{\pi_S+\pi_T} $$

1.1. nチームの場合
$$p_{ij}=\dfrac{\pi_i}{\pi_i+\pi_j}$$
ここで、$\pi_i>0 ,\, \pi_j >0$とする。
jチームがiチームに勝つ確率$p_{ji}$は
$$p_{ji}=1-p_{ij}=1-\dfrac{\pi_i}{\pi_i+\pi_j}=\dfrac{\pi_j}{\pi_i+\pi_j}$$
2. logit関数とロジスティック回帰

logit関数を利用して、確率を実数に変換すると
$$\text{logit}(p_{ij})= \log\left( \frac{p_{ij}}{1 - p_{ij}} \right) =\log\left(\dfrac{\dfrac{\pi_j}{\pi_i+\pi_j}}{\dfrac{\pi_i}{\pi_i+\pi_j}}\right)=\log\left(\dfrac{\pi_i}{\pi_j}\right)$$
ここで、$\pi_i=\beta_i$として各プレイヤー間の強さを評価すると、
$$\text{logit}(p_{ij})= \log\left(\dfrac{\pi_i}{\pi_j}\right)=\log(\pi_i)-\log(\pi_j)=\beta_i-\beta_j$$
このことから、Bradley–Terry modelはロジスティック回帰の式の形を導くことができる。
3. 例題
対戦ペア | 勝者 | 勝敗回数 |
---|---|---|
\( A \) vs \( B \) | \( A \) | 5回中3勝 |
\( B \) vs \( C \) | \( C \) | 4回中3勝 |
\( A \) vs \( C \) | \( A \) | 6回中4勝 |
チーム \( A \) がチーム \( B \) に勝つ確率$ p_{ab} $は
$$ p_{ab} = \dfrac{\pi_A}{\pi_A + \pi_B}=\dfrac{3}{5+3} =\dfrac{3}{8}$$
同様に、チーム \( C \) がチーム \( B \) に勝つ確率$p_{cb} $は
$$ p_{cb} = \frac{\pi_C}{\pi_C + \pi_B}=\dfrac{4}{4+3}=\dfrac{4}{7}$$
同様に、チーム \( A \) がチーム \( C \) に勝つ確率は
$$ p_{ab} = \dfrac{\pi_A}{\pi_A + \pi_C}=\dfrac{6}{6+4} =\dfrac{3}{5}$$