Bradley–Terry modelの意味と例題、ロジスティック回帰について

はるか
はるか
Bradley–Terryモデルは、スポーツの勝敗予測に使われる確率モデル。
ふゅか
ふゅか
うん、例えばチームの強さを使ってどっちが勝つか予測するのよね!

1. Bradley–Terry model

Bradley–Terryモデルは、ペア比較の結果を予測するために使用される確率モデルで、ランキングやレーティングシステムでよく使われます。スポーツや競技、などの勝敗を予測する際に利用されます。

SチームとTチームが野球の対戦をするとき、それぞれのチームの強さを$\pi_S,\pi_T$とする。SチームがTチームに勝つ確率を$p_{st}$とすると、

$$p_{st}=\dfrac{\pi_S}{\pi_S+\pi_T}$$

ただし引き分けは考えないものとする。

逆に、TチームがSチームに勝つ確率$p_{ts}$は

$$ p_{ts} = 1-\dfrac{\pi_S}{\pi_S+\pi_T} = \dfrac{\pi_T}{\pi_S+\pi_T} $$

はるか
はるか
言語モデルのRLHFやDPOに使われる。

1.1. nチームの場合

チームがn個ある場合の対戦を考える。n個のうちからiチームとjチームの対戦を考える。それぞれのチームの強さを$\pi_i,\,\pi_j$とする。iチームがjチームに勝つ確率$p_{ij}$は

$$p_{ij}=\dfrac{\pi_i}{\pi_i+\pi_j}$$

ここで、$\pi_i>0 ,\, \pi_j >0$とする。

jチームがiチームに勝つ確率$p_{ji}$は

$$p_{ji}=1-p_{ij}=1-\dfrac{\pi_i}{\pi_i+\pi_j}=\dfrac{\pi_j}{\pi_i+\pi_j}$$

2. logit関数とロジスティック回帰

 

はるか
はるか
logit関数で確率を実数に変換。

logit関数を利用して、確率を実数に変換すると

$$\text{logit}(p_{ij})= \log\left( \frac{p_{ij}}{1 - p_{ij}} \right) =\log\left(\dfrac{\dfrac{\pi_j}{\pi_i+\pi_j}}{\dfrac{\pi_i}{\pi_i+\pi_j}}\right)=\log\left(\dfrac{\pi_i}{\pi_j}\right)$$

ここで、$\pi_i=\beta_i$として各プレイヤー間の強さを評価すると、

$$\text{logit}(p_{ij})= \log\left(\dfrac{\pi_i}{\pi_j}\right)=\log(\pi_i)-\log(\pi_j)=\beta_i-\beta_j$$

このことから、Bradley–Terry modelはロジスティック回帰の式の形を導くことができる。

3. 例題

3チームの対戦を考える。チーム \( A \), \( B \), \( C \) がそれぞれ異なる強さ \( \pi_A, \pi_B, \pi_C \) を持つ。以下のような対戦結果が得られたとする。このデータを用いて、$p_{ab},\, p_{cb},\, p_{ac}$それぞれのチームの強さを推定する。
対戦ペア 勝者 勝敗回数
\( A \) vs \( B \) \( A \) 5回中3勝
\( B \) vs \( C \) \( C \) 4回中3勝
\( A \) vs \( C \) \( A \) 6回中4勝

チーム \( A \) がチーム \( B \) に勝つ確率$ p_{ab} $は

$$ p_{ab} = \dfrac{\pi_A}{\pi_A + \pi_B}=\dfrac{3}{5+3} =\dfrac{3}{8}$$

同様に、チーム \( C \) がチーム \( B \) に勝つ確率$p_{cb} $は

$$ p_{cb} = \frac{\pi_C}{\pi_C + \pi_B}=\dfrac{4}{4+3}=\dfrac{4}{7}$$

同様に、チーム \( A \) がチーム \( C \) に勝つ確率は

$$ p_{ab} = \dfrac{\pi_A}{\pi_A + \pi_C}=\dfrac{6}{6+4} =\dfrac{3}{5}$$

4. 関連した記事

PR