レーティング計算の結果は、その値である可能性が最も高いという事である。レートを確定値と捉えると、二人に一人は過大評
価していることになる。対局数が少ないとレートの誤差はかなり大きくなる。下の表は過大評価になっている可能性を示したものである。レートの差が大きい対
局からは得られる信頼度が低く、
実際の誤差はもうすこし大きい。
今回の元データには、下位の予選結果が含まれていないこともあって、「対局数が少ない=弱い」と推定できる。単一の値で棋士の強さを示そうとした場合、な んらかの補正をかける−低めに見積もるーと、信頼できる結果になりそうである。
例えば、10局打ってレートが8.00と計算されたのプレイヤーは、80%の確率で7.60以上のレートである。言い換えると過大評価の可能性は20%で ある。このあたりで評価するのが良いかもしれない。
しかし見通しが悪くなるので、注記のない場合、そのような補正はとくにしない計算結果をそのまま示してある。
(単純なモデルで、レート=8.00の場合。レートにより少し異なる。)
現在のレートが十分多くのサンプルにより計算されているのであれば、今から
プレイヤーABが対局するとして、 Aが勝利する確率Pabは、
Pab = 1 / ( 1 + exp(k*(Rb-Ra)) )
k = 0.95 + ( Ra + Rb ) / 40
例に当てはめるなら、羽根直樹対高尾紳路 0.382:0.618 となります。
この確率を元に七番勝負の結果を予測すると、
(結果は挑戦者から見て)
となります。しかし、起こりにくいことでは有るけれど、四連勝で終了などと言った場合、それは結構重いですから、現在のレート計算に用いられたサンプルに 対して十分に少なくは無いですね。
ポイントレートであれば、現在の点数は確定値ですので、「そこから急激に強さが変わった」と解釈することになるわけです。しかし、この確率モデルでは 「そんなに好結果であれば、以前から強かったのであろう。」と推定します。結果如何によって七番勝負以前のレートが変わってくるのです。
そこで、確率モデル全体としてそれぞれのパターンが起こる確率を計算します。実際には全てのパターン(70通り)を計算するには時間がかかりすぎるの で、勝敗数ごとにひとつのパターンについて計算しました。
A'=e^(A列)がそれぞれのパターンがその結果。
現在までの対局総数41,313の結果の生じる確率A0=e^-20710.09
B列はA0/A'
C列はB列に組み合わせの数をかけたもので、これがそれぞれの勝敗結果が起こる比となります。中央付近は上の簡易計算と近い数であるけれど、端のほうがず いぶんと起こりやすくなっています。これは「極端な」結果となった場合、現在までの結果から計算するのとは違ったレートを七番勝負前に推定し、そのことに よってモデル全体の結果が起こる確率を最大化するからです。
したがって、C列の計が1.000を大きく超えていますが、これで合っています。
C列を計で割り、求める確率を得ました。
簡易計算よりもかなり広い分散となりました。
(結果は挑戦者から見て)
下表はそれぞれの勝敗結果のときのレート。
上段:高尾紳路
下段:羽根直樹
(結果は挑戦者から見て)
レーティング的には挑戦者三勝で健闘、評価UPとなりますね。一般の評価としては最終局の勝敗はえらく重いですが、レーティングにとっては只の一勝/一敗 です。また、無駄勝ちというものも有りませんから。
その一方で、レートが乱高下する可能性はかなり低く、安定性、信頼度も確認されました。
なお、持ち時間の特性上、一方が有利でないかとは思いますが、今のところの計算では考慮されていません。
今回の元データには、下位の予選結果が含まれていないこともあって、「対局数が少ない=弱い」と推定できる。単一の値で棋士の強さを示そうとした場合、な んらかの補正をかける−低めに見積もるーと、信頼できる結果になりそうである。
例えば、10局打ってレートが8.00と計算されたのプレイヤーは、80%の確率で7.60以上のレートである。言い換えると過大評価の可能性は20%で ある。このあたりで評価するのが良いかもしれない。
しかし見通しが悪くなるので、注記のない場合、そのような補正はとくにしない計算結果をそのまま示してある。
誤差 | 勝率 | 10局 | 20局 | 40局 | 80局 | 160局 |
---|---|---|---|---|---|---|
0.00 | 0.50 | 0.50 | 0.50 | 0.50 | 0.50 | 0.50 |
0.10 | 0.53 | 0.42 | 0.38 | 0.34 | 0.27 | 0.20 |
0.20 | 0.57 | 0.34 | 0.28 | 0.20 | 0.12 | 0.04 |
0.30 | 0.60 | 0.27 | 0.18 | 0.10 | 0.04 | 0.01 |
0.40 | 0.63 | 0.20 | 0.12 | 0.05 | 0.01 | 0.00 |
0.50 | 0.66 | 0.15 | 0.07 | 0.02 | 0.00 | 0.00 |
0.60 | 0.69 | 0.11 | 0.04 | 0.01 | 0.00 | 0.00 |
0.70 | 0.72 | 0.08 | 0.02 | 0.00 | 0.00 | 0.00 |
0.80 | 0.75 | 0.05 | 0.01 | 0.00 | 0.00 | 0.00 |
0.90 | 0.77 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 |
1.00 | 0.79 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 |
-本因坊挑戦を例として-
架空のデータによる折線モデルの実験です。現在のレートが十分多くのサンプルにより計算されているのであれば、今から
プレイヤーABが対局するとして、 Aが勝利する確率Pabは、
Pab = 1 / ( 1 + exp(k*(Rb-Ra)) )
k = 0.95 + ( Ra + Rb ) / 40
例に当てはめるなら、羽根直樹対高尾紳路 0.382:0.618 となります。
この確率を元に七番勝負の結果を予測すると、
結果 |
確率 |
計 |
4-0 |
0.021 | 0.256 |
4-1 |
0.053 | |
4-2 |
0.081 | |
4-3 |
0.100 | |
3-4 |
0.163 | 0.744 |
2-4 |
0.213 | |
1-4 |
0.223 | |
0-4 |
0.146 |
となります。しかし、起こりにくいことでは有るけれど、四連勝で終了などと言った場合、それは結構重いですから、現在のレート計算に用いられたサンプルに 対して十分に少なくは無いですね。
ポイントレートであれば、現在の点数は確定値ですので、「そこから急激に強さが変わった」と解釈することになるわけです。しかし、この確率モデルでは 「そんなに好結果であれば、以前から強かったのであろう。」と推定します。結果如何によって七番勝負以前のレートが変わってくるのです。
そこで、確率モデル全体としてそれぞれのパターンが起こる確率を計算します。実際には全てのパターン(70通り)を計算するには時間がかかりすぎるの で、勝敗数ごとにひとつのパターンについて計算しました。
A'=e^(A列)がそれぞれのパターンがその結果。
現在までの対局総数41,313の結果の生じる確率A0=e^-20710.09
B列はA0/A'
C列はB列に組み合わせの数をかけたもので、これがそれぞれの勝敗結果が起こる比となります。中央付近は上の簡易計算と近い数であるけれど、端のほうがず いぶんと起こりやすくなっています。これは「極端な」結果となった場合、現在までの結果から計算するのとは違ったレートを七番勝負前に推定し、そのことに よってモデル全体の結果が起こる確率を最大化するからです。
したがって、C列の計が1.000を大きく超えていますが、これで合っています。
C列を計で割り、求める確率を得ました。
簡易計算よりもかなり広い分散となりました。
結果 |
A |
B |
勝敗 |
C |
確率 |
簡易 |
|
○○○○ | -20712.94 | 0.058 | 4-0 | 0.058 | 0.050 |
0.355 |
0.021 |
○○●○○ | -20713.73 | 0.026 | 4-1 | 0.105 | 0.090 |
0.053 |
|
○●○○●○ | -20714.47 | 0.012 | 4-2 | 0.125 | 0.107 |
0.081 |
|
○●○●○●○ | -20715.14 | 0.006 | 4-3 | 0.128 | 0.110 |
0.100 |
|
●○●○●○● | -20714.93 | 0.008 | 3-4 | 0.158 | 0.135 |
0.645 |
0.163 |
●○●●○● | -20714.00 | 0.020 | 2-4 | 0.200 | 0.170 |
0.213 |
|
●●○●● | -20712.98 | 0.056 | 1-4 | 0.224 | 0.191 |
0.223 |
|
●●●● | -20711.84 | 0.174 | 0-4 | 0.174 | 0.148 |
0.146 |
|
1.172 |
下表はそれぞれの勝敗結果のときのレート。
上段:高尾紳路
下段:羽根直樹
結果 | 勝 | 敗 | 05/11 | 06/5 | 06/11 | 07/5 | 07/8 | 07/11 | 08/2 | 08/5 |
4-0 | 167 | 83 | 8.52 | 8.50 | 8.60 | 8.59 | 8.61 | 8.63 | 8.58 | 8.54 |
137 | 98 | 8.31 | 8.24 | 8.18 | 8.21 | 8.31 | 8.38 | 8.47 | 8.54 | |
4-1 | 168 | 83 | 8.52 | 8.50 | 8.60 | 8.60 | 8.62 | 8.64 | 8.60 | 8.57 |
137 | 99 | 8.31 | 8.24 | 8.18 | 8.20 | 8.29 | 8.36 | 8.45 | 8.50 | |
4-2 | 169 | 83 | 8.53 | 8.51 | 8.60 | 8.61 | 8.63 | 8.66 | 8.62 | 8.60 |
137 | 100 | 8.31 | 8.23 | 8.17 | 8.19 | 8.28 | 8.34 | 8.42 | 8.47 | |
4-3 | 170 | 83 | 8.53 | 8.51 | 8.61 | 8.61 | 8.64 | 8.67 | 8.64 | 8.63 |
137 | 101 | 8.31 | 8.23 | 8.17 | 8.18 | 8.26 | 8.32 | 8.40 | 8.44 | |
3-4 | 171 | 82 | 8.53 | 8.51 | 8.62 | 8.63 | 8.66 | 8.70 | 8.68 | 8.68 |
136 | 102 | 8.31 | 8.23 | 8.16 | 8.16 | 8.24 | 8.29 | 8.35 | 8.37 | |
現在 | 167 | 79 | 8.53 | 8.51 | 8.62 | 8.64 | 8.67 | 8.71 | 8.70 | 8.70 |
133 | 98 | 8.31 | 8.23 | 8.15 | 8.16 | 8.23 | 8.28 | 8.33 | 8.35 | |
2-4 | 171 | 81 | 8.53 | 8.52 | 8.62 | 8.64 | 8.67 | 8.72 | 8.71 | 8.72 |
135 | 102 | 8.30 | 8.22 | 8.15 | 8.15 | 8.22 | 8.26 | 8.31 | 8.33 | |
1-4 | 171 | 80 | 8.53 | 8.52 | 8.63 | 8.65 | 8.69 | 8.74 | 8.74 | 8.76 |
134 | 102 | 8.30 | 8.22 | 8.14 | 8.14 | 8.20 | 8.24 | 8.28 | 8.28 | |
0-4 | 171 | 79 | 8.53 | 8.52 | 8.63 | 8.66 | 8.70 | 8.76 | 8.77 | 8.80 |
133 | 102 | 8.30 | 8.22 | 8.14 | 8.12 | 8.18 | 8.21 | 8.24 | 8.23 |
レーティング的には挑戦者三勝で健闘、評価UPとなりますね。一般の評価としては最終局の勝敗はえらく重いですが、レーティングにとっては只の一勝/一敗 です。また、無駄勝ちというものも有りませんから。
その一方で、レートが乱高下する可能性はかなり低く、安定性、信頼度も確認されました。
なお、持ち時間の特性上、一方が有利でないかとは思いますが、今のところの計算では考慮されていません。