続・東風ランキング
麻雀くんさん、キーパーさんから指摘をもらったとおり、R2000以下の雀士については、1/19以前のデータがランキングに載って無いので先日のグラフは激しく変。あまり信用しないでください。
とりあえず、自宅Linux鯖で毎日朝6時にランキングページのデータをダウンロードして、HTMLからCSVに変換するスクリプトを作成した。これで、しばらく定期的に観察してみる予定。
でもやっぱ、下ランのデータも欲しいところ。以前自分でランキングページと同じようなことをするモノが作れないかと、東風荘のネットワークプロトコルを軽く調査したことはある。案外単純なプロトコルっぽい感じだったんで、解析しようと思えば出来るはず。そのうちやりたい。今はとても手が回らないけど。
それと、まったり麻雀の方は、長期ランニングテスト中。今のところ重大なバグは出て無い模様。
| 固定リンク
この記事へのコメントは終了しました。
コメント
Rランキングのシステム変更前のデータ
http://66.102.7.104/search?q=cache:f-VSIVQQfc4J:tonpusoranking.hp.infoseek.co.jp/1cho.html+%E6%9D%B1%E9%A2%A8%E8%8D%98%E3%80%80%E3%83%A9%E3%83%B3%E3%82%AD%E3%83%B3%E3%82%B0&hl=ja
を見て考えるに、どうやらある程度以上時間が経過してもランキングが正確に分布を表さなそうな恐れが。というのも一度ランキングから消えてしまうと再び捕捉されるまでに時間がかかるために超落ちに近い程記載率が下がる可能性が高いためです。具体的にどう超ランプレイヤーを捕捉しているのかはよく分かりませんが、以前のデータでも2000に近いプレイヤー程不自然に少なくなっているので(牌譜での他家R分布は最頻値が2000弱あたり)。一応いくつかの仮定を立てれば超ラン内の分布のパラメーターのみから全体の分布を計算する事は可能で現在研究してるのはその辺なんですが、実際に測定できるんなら完全にその必要なくなりますね(汗)。
投稿: キーパー | 2006/01/22 04:42
データの補足の仕方ですけど、
「次々に超ランの"卓情報"を見て、そこに載ってる4人分のハンドル名を/wコマンドと/rコマンドで調べてランキングを更新する。」ということすべての超ラン卓を順番に巡回して行なっている感じがします。
もちろん人間ではなくてコンピュータにやらせているんでしょう。
ランキングシステムが私のデータの捕捉してる状況を、私が観察してる限りだと、最後に超で打っている時点のデータが必ずランキングに載ります。1週間超で打たないとランキングからは外れるみたい。超ランで打てば確実にランキングに反映されるようです。今まで例外はありませんでした。少なくとも第2で自分が打って確かめた範囲ではそんな感じです。
卓の数が多くて試合時間が短い第一だと、ランキングシステムがすべての卓を巡回しきる前に試合が終わってしまって、超ランで打っていても反映されないということがあるのかな?
全体の分布はよくわかりませんね。超ランの牌譜から、全体像を想像するかぎりだと、綺麗な標準偏差の山にならないで途中でこぶが出来る感じに思えますが、確信はまったく無いです。
>以前のデータでも2000に近いプレイヤー程不自然に少なくなっているので(牌譜での他家R分布は最頻値が2000弱あたり)。
これは知りませんでした。理由がまったく分かりません。
>現在研究してるのはその辺なんですが、実際に測定できるんなら完全にその必要なくなりますね(汗)。
「自分の研究活動が無駄になるのでは?」という想いはなんとなく判る気がします。私も別の人が私の活動と同様のことをやってるのを見ると、似たような感情になることがあります。
けれど、私としては是非キーパーさんに研究を進めて欲しいと思います。
もし、将来、全体のR分布がどうなっているのか、誰かが実際に測定して発表したとしても、そのとき、ご自身の予測が当たってるかどうかが分かるってのは、それはそれで面白いんでは無いでしょうか。
下ランのランキングデータを取るプログラムを作りたいという気持ちはあります。けれど、他にやりたいことがあるんで現実的には手が回らないと思います。もしやるとしても相当先(数年後とか)になると思います。すいません。
投稿: kmo2 | 2006/01/22 23:08
>そこに載ってる4人分のハンドル名を/wコマンドと/rコマンドで調べてランキングを更新する。」ということすべての超ラン卓を順番に巡回して行なっている感じがします。
探索方法はそれだけではないと思います。第一の話になりますが、ランキングを観察するに、基本的には確かに最後の1試合でのRateが載る場合が多いんですが、たまに数試合やっても更新されないことがあります。一方で最後の1試合の後しばらく観戦も試合もせず接続したまま放っておくとそれでも数分後には大抵更新されているので、「各卓の試合者を全て探索」というのはメインの更新方法ではなく、基本「リストに既に載っているプレイヤーを再検索」としつつ、たまに「全卓探索して新規者の捕捉」とやっているんじゃないかと私は考えます(そう考えると2000付近で少なくなっていたのに説明がつく)。
>もし、将来、全体のR分布がどうなっているのか、誰かが実際に測定して発表したとしても、そのとき、ご自身の予測が当たってるかどうかが分かるってのは、それはそれで面白いんでは無いでしょうか
確かにそれも悪くないですね。全体のR分布を知ることには単純な興味以上の大きな意味があり、全体での実力分布(というか分散)および「超ラン内のRateの真の(下ランから見た)実力からの乖離」さえ知れば、真に個人の成績を偏差値化できるようになります。偏差値化さえ出来れば第1と第2の比較が可能になるので真に意味のある安定Rateの互換が可能になり、スコアが第2プレイヤーに不利にならなくなるのでは、というわけです。いかんせん現在試験の最中でして十分作業が出来ないのが非常に悔しいのですがなんとか早く形にして公開したいところです。
投稿: キーパー | 2006/01/23 00:20
>基本「リストに既に載っているプレイヤーを再検索」としつつ、たまに「全卓探索して新規者の捕捉」とやっているんじゃないかと私は考えます
そうかもしれません。今度から、もう少し意識して確認してみます。
今にして思えば、私はログインしてすぐ打ち、すぐログアウトすることが多かったように思います。
>全体での実力分布(というか分散)および「超ラン内のRateの真の(下ランから見た)実力からの乖離」さえ知れば、真に個人の成績を偏差値化できるようになります。
第一と第二の全体のR分布具合が分かると、成績の比較など色々面白いことが分かるかもしれませんね。個人的にはオーラス間際の打ち方の巧拙が成績に与える影響が測れる可能性があるんじゃないかと思ってます。
>いかんせん現在試験の最中でして十分作業が出来ないのが非常に悔しいのですがなんとか早く形にして公開したいところです。
急かすつもりはありませんでした。学業や仕事など、もっと大切なものは多いですからね。麻雀って一生モノの趣味に出来ると思いますから、ゆっくり付き合っていけばいいのかなと思います。
投稿: kmo2 | 2006/01/23 01:36
また、ランキング形式が変わってますね。新形式に対応するようにスクリプト変えたけど。またすぐ変わるかも。
>基本「リストに既に載っているプレイヤーを再検索」としつつ、たまに「全卓探索して新規者の捕捉」とやっているんじゃないかと私は考えます
荘では無いように思えますね。例えば、超で打ち終わったあと。
/wでRateを確認してすぐにログアウト。
ランキングHPで情報を確認
->1試合前の情報になってる。
しばらくして、ログイン。打たずにそのままずっと待機
->1試合前の情報のまま更新されない。
なんで、やっぱ私がコメントに書いたとおりだと思う。
投稿: kmo2 | 2006/01/24 01:15
確かに・・・一旦ログアウトすると放置しても更新されなくなりますね。これは気付きませんでした。新たなランキング形式は普通の人に需要があるのかは分かりませんが1600以上が全て集計されるというのは有り難い限りですね。
投稿: キーパー | 2006/01/24 04:04
>新たなランキング形式は普通の人に需要があるのかは分かりませんが1600以上が全て集計されるというのは有り難い限りですね。
まったく同感です。
超ランがあることで正規分布にならずに裾野に小山が出来ているかどうかぐらいはすぐに分かりそうです。
1週間ほどたったら集計したいです。
投稿: kmo2 | 2006/01/24 23:56
その集計(下ランも)期待してます。
棒グラフ付きで。
投稿: ななし | 2006/01/27 04:51
>その集計(下ランも)期待してます。
>棒グラフ付きで。
やりたいですね。下ラン、超ラン統合したグラフを書くつもりです。
23日に下ランデータが取れるようになったのでそこから1週間は最低あけないといけないんで、まだデータ集計はできませんが、来週末あたりにはグラフを載せます。
投稿: kmo2 | 2006/01/27 12:27