ELO Rating System

ロン2で使われているというので、ちょっと調べてみた。サイトによって違いがあったので、分かりやすかったアメリカのwikipediaより。
\large R_{new}=R_{old}+K(W-P(D))
s.t.
R:レート
K:変動係数(大きいほど変動しやすい=最近の結果が現れる)
W:試合結果(勝ち:1、引き分け:0.5、負け:0 )
P():正規分布に基づく勝率の期待値
D:自分基準のR_{old}の差(R_{rival's}-R_{my}

\large P(D)=\frac{1}{1-10^{\frac{D}{400}}}
(これは、
\large\frac{1}{2}+\int_{0}^{D} \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{x^2}{2\sigma^2}}dxの簡略形)
当然P(D)+P(-D)=1です。

フォントの関係かtexの式が綺麗にでませんねぇ。

で、いいたいことはというと、チェスのような実力差があるゲームならいいんだけど、麻雀のように不確定要素が強い(=実力が定かではない)ゲームに、この評価方法はマッチするのか?ということ。麻雀は1vs3ではなく、2vs2でもなく、1vs1vs1vs1なわけで、トップが偉いのか、ラスは駄目なのか、よくわからん。というのは建前で、なんでロン2勝てないのぉぉぉぉぉと言いたい。はい。

101の評価方法もなかなかすてきやねぇ、とか。

適当に計算してみたとろ、安定Rは、
\large r=av-400\log(1-\frac1{w})
s.t.
r:安定R
av:他家平均R
w:順位率
となりました。

これだとマッチング機能が不公平ってことになりますね。まぁこれは1vs1をそのまま流用したし、そもそも適当ですからね。
どうなのよ。

何切るね、、、おいおい。