囲碁のレーティング

レーティング計算の結果は、その値である可能性が最も高いという事である。レートを確定値と捉えると、二人に一人は過大評価していることになる。対局数が少ないとレートの誤差はかなり大きくなる。下の表は過大評価になっている可能性を示したものである。レートの差が大きい対局からは得られる信頼度が低く、実際の誤差はもうすこし大きい。

今回の元データには、下位の予選結果が含まれていないこともあって、「対局数が少ない＝弱い」と推定できる。単一の値で棋士の強さを示そうとした場合、なんらかの補正をかける－低めに見積もるーと、信頼できる結果になりそうである。

例えば、10局打ってレートが8.00と計算されたのプレイヤーは、80%の確率で7.60以上のレートである。言い換えると過大評価の可能性は20%である。このあたりで評価するのが良いかもしれない。

しかし見通しが悪くなるので、注記のない場合、そのような補正はとくにしない計算結果をそのまま示してある。

誤差	勝率	10局	20局	40局	80局	160局
0.00	0.50	0.50	0.50	0.50	0.50	0.50
0.10	0.53	0.42	0.38	0.34	0.27	0.20
0.20	0.57	0.34	0.28	0.20	0.12	0.04
0.30	0.60	0.27	0.18	0.10	0.04	0.01
0.40	0.63	0.20	0.12	0.05	0.01	0.00
0.50	0.66	0.15	0.07	0.02	0.00	0.00
0.60	0.69	0.11	0.04	0.01	0.00	0.00
0.70	0.72	0.08	0.02	0.00	0.00	0.00
0.80	0.75	0.05	0.01	0.00	0.00	0.00
0.90	0.77	0.03	0.00	0.00	0.00	0.00
1.00	0.79	0.02	0.00	0.00	0.00	0.00

（単純なモデルで、レート=8.00の場合。レートにより少し異なる。)

-本因坊挑戦を例として-

　架空のデータによる折線モデルの実験です。
現在のレートが十分多くのサンプルにより計算されているのであれば、今から
プレイヤーABが対局するとして、 Aが勝利する確率Pabは、
Pab = 1 / ( 1 + exp(k*(Rb-Ra)) )
k = 0.95 + ( Ra + Rb ) / 40
例に当てはめるなら、羽根直樹対高尾紳路　0.382:0.618　となります。
この確率を元に七番勝負の結果を予測すると、

結果	確率	計
4-0	0.021	0.256
4-1	0.053
4-2	0.081
4-3	0.100
3-4	0.163	0.744
2-4	0.213
1-4	0.223
0-4	0.146

（結果は挑戦者から見て）
となります。しかし、起こりにくいことでは有るけれど、四連勝で終了などと言った場合、それは結構重いですから、現在のレート計算に用いられたサンプルに対して十分に少なくは無いですね。
　ポイントレートであれば、現在の点数は確定値ですので、「そこから急激に強さが変わった」と解釈することになるわけです。しかし、この確率モデルでは「そんなに好結果であれば、以前から強かったのであろう。」と推定します。結果如何によって七番勝負以前のレートが変わってくるのです。
　そこで、確率モデル全体としてそれぞれのパターンが起こる確率を計算します。実際には全てのパターン（70通り）を計算するには時間がかかりすぎるので、勝敗数ごとにひとつのパターンについて計算しました。
A'=e^（A列）がそれぞれのパターンがその結果。
現在までの対局総数41,313の結果の生じる確率A0=e^-20710.09
B列はA0/A'
C列はB列に組み合わせの数をかけたもので、これがそれぞれの勝敗結果が起こる比となります。中央付近は上の簡易計算と近い数であるけれど、端のほうがずいぶんと起こりやすくなっています。これは「極端な」結果となった場合、現在までの結果から計算するのとは違ったレートを七番勝負前に推定し、そのことによってモデル全体の結果が起こる確率を最大化するからです。
したがって、C列の計が1.000を大きく超えていますが、これで合っています。
C列を計で割り、求める確率を得ました。
簡易計算よりもかなり広い分散となりました。

結果	A	B	勝敗	C	確率		簡易
○○○○	-20712.94	0.058	4-0	0.058	0.050	0.355	0.021
○○●○○	-20713.73	0.026	4-1	0.105	0.090		0.053
○●○○●○	-20714.47	0.012	4-2	0.125	0.107		0.081
○●○●○●○	-20715.14	0.006	4-3	0.128	0.110		0.100
●○●○●○●	-20714.93	0.008	3-4	0.158	0.135	0.645	0.163
●○●●○●	-20714.00	0.020	2-4	0.200	0.170		0.213
●●○●●	-20712.98	0.056	1-4	0.224	0.191		0.223
●●●●	-20711.84	0.174	0-4	0.174	0.148		0.146
				1.172

（結果は挑戦者から見て）

下表はそれぞれの勝敗結果のときのレート。
上段：高尾紳路
下段：羽根直樹

結果	勝	敗	05/11	06/5	06/11	07/5	07/8	07/11	08/2	08/5
4-0	167	83	8.52	8.50	8.60	8.59	8.61	8.63	8.58	8.54
4-0	137	98	8.31	8.24	8.18	8.21	8.31	8.38	8.47	8.54
4-1	168	83	8.52	8.50	8.60	8.60	8.62	8.64	8.60	8.57
4-1	137	99	8.31	8.24	8.18	8.20	8.29	8.36	8.45	8.50
4-2	169	83	8.53	8.51	8.60	8.61	8.63	8.66	8.62	8.60
4-2	137	100	8.31	8.23	8.17	8.19	8.28	8.34	8.42	8.47
4-3	170	83	8.53	8.51	8.61	8.61	8.64	8.67	8.64	8.63
4-3	137	101	8.31	8.23	8.17	8.18	8.26	8.32	8.40	8.44
3-4	171	82	8.53	8.51	8.62	8.63	8.66	8.70	8.68	8.68
3-4	136	102	8.31	8.23	8.16	8.16	8.24	8.29	8.35	8.37
現在	167	79	8.53	8.51	8.62	8.64	8.67	8.71	8.70	8.70
現在	133	98	8.31	8.23	8.15	8.16	8.23	8.28	8.33	8.35
2-4	171	81	8.53	8.52	8.62	8.64	8.67	8.72	8.71	8.72
2-4	135	102	8.30	8.22	8.15	8.15	8.22	8.26	8.31	8.33
1-4	171	80	8.53	8.52	8.63	8.65	8.69	8.74	8.74	8.76
1-4	134	102	8.30	8.22	8.14	8.14	8.20	8.24	8.28	8.28
0-4	171	79	8.53	8.52	8.63	8.66	8.70	8.76	8.77	8.80
0-4	133	102	8.30	8.22	8.14	8.12	8.18	8.21	8.24	8.23

（結果は挑戦者から見て）

レーティング的には挑戦者三勝で健闘、評価UPとなりますね。一般の評価としては最終局の勝敗はえらく重いですが、レーティングにとっては只の一勝／一敗です。また、無駄勝ちというものも有りませんから。
その一方で、レートが乱高下する可能性はかなり低く、安定性、信頼度も確認されました。
なお、持ち時間の特性上、一方が有利でないかとは思いますが、今のところの計算では考慮されていません。

対局数とレートの信頼度

-本因坊挑戦を例として-