ELO Rating System - だらだらとだらだら

ロン２で使われているというので、ちょっと調べてみた。サイトによって違いがあったので、分かりやすかったアメリカのwikipediaより。
$\large R_{new}=R_{old}+K(W-P(D))$
s.t.
R:レート
K:変動係数（大きいほど変動しやすい＝最近の結果が現れる）
W:試合結果（勝ち:1、引き分け:0.5、負け:0 ）
P():正規分布に基づく勝率の期待値
D:自分基準の $R_{old}$ の差（ $R_{rival's}-R_{my}$ ）

$\large P(D)=\frac{1}{1-10^{\frac{D}{400}}}$
（これは、
$\large\frac{1}{2}+\int_{0}^{D} \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{x^2}{2\sigma^2}}dx$ の簡略形）
当然 $P(D)+P(-D)=1$ です。

フォントの関係かtexの式が綺麗にでませんねぇ。

で、いいたいことはというと、チェスのような実力差があるゲームならいいんだけど、麻雀のように不確定要素が強い（＝実力が定かではない）ゲームに、この評価方法はマッチするのか？ということ。麻雀は1vs3ではなく、2vs2でもなく、1vs1vs1vs1なわけで、トップが偉いのか、ラスは駄目なのか、よくわからん。というのは建前で、なんでロン２勝てないのぉぉぉぉぉと言いたい。はい。

101の評価方法もなかなかすてきやねぇ、とか。

適当に計算してみたとろ、安定Rは、
$\large r=av-400\log(1-\frac1{w})$
s.t.
r:安定R
av:他家平均R
w:順位率
となりました。

これだとマッチング機能が不公平ってことになりますね。まぁこれは1vs1をそのまま流用したし、そもそも適当ですからね。
どうなのよ。

何切るね、、、おいおい。