新旧アルゴリズムの選択の違い
同一局面を現在開発中のアルゴリズムと現在公開しているアルゴリズムで打牌に差がでたものをピックアップ。
各画像の左下の方にあるデバックというタイトルバーの部分が選択した打牌で、カッコの中の数字は推定局収支期待値です。
局面自体は過去にtwitterに挙げたものと一緒です。
6
7
8
新アルゴリズム、変更したのは、平場の中巡以降の鳴き判断と打牌選択です。こう見ると全体的に良くなってる気します。ですが、新旧のアルゴリズムの選択に差が出る局面自体が少ないこともあり、実際に対局させてみてどの程度成績に違いがでるかというと、現行アルゴリズム3人(?)vs新アルゴリズムでやってみて、新アルゴリズムの平均順位がせいぜい2.46になる程度です。
目標としているのは、平均順位2.40ですがまだそれには遠く及びません。しかも、現在ものすごく遅くてとてもゲームとして楽しめるレベルではないのが現状です。(CPU Core i7 990xで15秒程度考えることも)
今後これに加えて点数状況判断も改造する予定だけれど、果たしてそれで、目標をクリアできるかどうかあまり自信はなく、公開時期はまだ当面先になりそうな気配です。
| 固定リンク
この記事へのコメントは終了しました。
コメント