データ取ってみた
東南戦1000試合で鳴き仕掛けに対してベタオリすべきと判断した局面は638回。
その局面で降りなかったときの局平均収支は-980。
評価関数で推測した値との差もデータ取ってみた。
3向聴以上はリアルタイムに期待値計算できないので対象外として、
2向聴以内の手で集計すると、
ベタオリすべき対象となる局面数は559回
そのときの局平均収支は-920。
評価関数での計算値では期待値-860。
これだけ比較してみると評価関数の出来はそれなりに良さげだけど、個々の局面の場合わけが甘いんで、リアルタイムで見ているとイマイチな印象を受ける。
さて、局平均収支-980って数字はどう見るべきか。
ベタオリしたときのマイナスとそれほど差が出ない数字なら降りても仕方ない気もする。
計算上、ベタオリしたときの評価関数での局平均期待値は-450と出ている。倍も違うといえなくも無い。
まずは、降りたときの局収支を集計できるようにプログラムしていく。
| 固定リンク
この記事へのコメントは終了しました。
コメント