データ比較
新旧アルゴリズムの1万試合分のできすぎ君データ
新アルゴリズム
気になるのは、和了点数が低くなってることと、先制リーチ率が低くなってること。
これはなんなんだろうな。。。
それほど大きくアルゴリズムが違うわけではない。
変えたのは。
七対子と一般手のアルゴリズムの統合。
ロンの扱いをより正確に。(旧アルゴリズムはロンの価値がやや高すぎる)
不聴罰科供託リーチ棒の扱いをまじめにやるようにした。
他家和了データを変更。(やや他家の速度がぬるい?)
和了点数が低くなってるのに、和了率も低いってのがよくわからない。
被先制リーチ時の点数は以下。ほぼ、誤差の範囲だとおもうが、被先制を若干食らいがちってことは、1向聴か2向聴で無駄に良形聴牌を目指しすぎて、先制リーチが遅れて後手を踏んでるのかもしれない。または、鳴き仕掛けに対して降りすぎているってことなのかもしれない。
新アルゴリズム
被先制リーチ時収支 平均-676.797510 -33707900/49805(トータル/回数)
旧アルゴリズム
被先制リーチ時収支 平均-677.002521 -33562400/49575(トータル/回数)
ちなみに先制リーチ時は以下。
新アルゴリズム
先制リーチ時収支 平均2075.153045 38643500/18622(トータル/回数)
旧アルゴリズム
先制リーチ時収支 平均2023.080701 41187900/20359(トータル/回数)
うーんなぜだ。分からん。
まずは、鳴きに降りすぎているかどうかを調べてみるべきかなあ……でも被先制の収支がさほど変わらないところを見るとあまり意味を成さないかもしれない。
それとも、他家の和了速度をもっと高く見積もるようにするべきか……
| 固定リンク
この記事へのコメントは終了しました。
コメント
リーチ平均巡目自体は新の方が早いのに、旧に先制リーチ率で負けてるのはなんでだろう?
と思ったら、追っかけリーチ率は旧の方が高いんですね……
ってなぜこんなことが!?
追っかけリーチの機会は新のほうが多いはずなのに。
新の降り過ぎが原因?
あと流局時テンパイ率は40%以上ある方が優れているらしいです(他人情報)
投稿: なな | 2009/01/19 21:51
返事が遅れすいません。
色々忙しくてなかなか自宅に戻れない状況でして……
>リーチ平均巡目自体は新の方が早いのに、旧に先制リーチ率で負けてるのはなんでだろう?と思ったら、追っかけリーチ率は旧の方が高いんですね……
これはたぶんそのとおりですね。
遅い段階では突っ張らずにおりてるので平均巡目が早く見えるってことでしょう。
降りすぎか?というと、被先制リーチ時の平均点数からしてそうでもなさそうなんです。
単純なバグか思い違いがあるのだとおもいます。
投稿: kmo2 | 2009/01/24 23:21
はじめまして、じゅんじと申します。
まったり麻雀をダウンロードさせていただきました o(*^▽^*)o
実は今日初めて友達に麻雀を教わり、面白かったのでこれからちゃんとルールを覚えて勉強しようと思っています。
まったり麻雀にて、コンピュータ同士のデモを牌譜出力できませんでしょうか。
一手ごとに、自分の考えた手と、コンピュータの打つ手とを比較できれば、状況判断の勉強になるのではないかと思いました。
また、デモのスピードが速くて目で追うことができませんので、マウスクリックで順送りできると面白そうだなぁ、と思いました。
勝手な要望ばかりで申し訳ありませんが、ご一考いただけますと嬉しいです。
どうぞ今後も開発がんばってください m(_ _)m
投稿: じゅんじ | 2009/01/29 00:20
お久し振りです。
ちょっといい加減で且つ大胆ですが、このプログラムはハイパイよりツモ重視になっているはず(?)ですよね。
新旧そのままとして、根っこの部分でハイパイ重視で変更とかダメでしょうか?
つまり、新はハイパイ重視。
ハイパイの段階で攻める・攻めない・まぁ中間(半ば抜き)ってな感じで旧と比較してみるというのはダメでしょうか?
すでに試しておられるのであれば、これは無視してください。
投稿: モンテカルロ・モナコ | 2009/01/31 00:27
追加で
囲碁・将棋では絶対に白黒(勝ち負け)をつけないといけない。
麻雀ではその必用がない。
アングロサクソンかフランス・イタリアかって感じです。
投稿: モンテカルロ・モナコ | 2009/01/31 00:55
>じゅんじさん
マージャンのルールは結構面倒で覚えるのが大変かとは思いますが、マージャン自体は割りと末永く楽しめる娯楽なんでそれだけの苦労の甲斐はあると思います。
コンピュータ同士対戦のログ程度なら割と簡単に出来ますので、次あたりで実装します。
問題は次が出せるかですけど……
それまではデュプリケートモードで勘弁してください。
投稿: kmo2 | 2009/02/01 00:06
>ちょっといい加減で且つ大胆ですが、このプログラムはハイパイよりツモ重視になっているはず(?)ですよね。
ある意味そうですね。配牌が悪いからといって最初からディフェンシブになったりせずに目いっぱい手を広げますから。
>新旧そのままとして、根っこの部分でハイパイ重視で変更とかダメでしょうか?
私が補助評価関数を勝手に呼んでる孤立牌単独の価値を点数付けする部分があるんですが、そこの点数づけを変えてみるのはアリかもしれません。
(点数状況も絡むでしょうけれど)あがれそうにない状態だったらディフェンシブにするとか試してみるのもアリかもしれません。
投稿: kmo2 | 2009/02/01 00:11
実装検討ありがとうございます (≧∇≦)
ただいま本を買って勉強中で、役を覚えないとなー、とかやってます。
次のアップを楽しみにしつつ、気長に待たせていただきます。
投稿: じゅんじ | 2009/02/03 12:47