2008/07/01

思い切り修正してみる

他家挙動の修正をする際、いままで、暫定的に対処していた部分がネックになりそうなんで、この際思い切って修正することにする。

まずは、ベタオリモード、通常モード、七対子モードと分かれていた評価関数のアルゴリズムを統合してひとつのアルゴリズムで処理できるようにする。

染め手モードや鳴き仕掛けモードも将来的には統合したいけれどまだそこまではできそうに無い。

これだけ大幅に修正してもそれほど強くはならないだろうけれど、今後の作業がやりやすくなるので基盤整備の意味も含めて改造してみる。

| | コメント (0) | トラックバック (0)

2008/06/25

他家挙動修正中

天鳳の解析ツールつくってくれた人いるみたいです。
http://www.geocities.jp/tenhoukaiseki/
できすぎ君相当の機能があるので助かります。ありがたく使わせてもらいます。
なので私は解析ツール作るのストップ。いずれ、牌譜解析用に作ると思いますがたぶん非公開。

さて、開発作業の方は他家挙動の修正のために、メインの評価関数を修正中。やたら面倒でドつぼにはまってます。まともにコンパイルが通らない状態いまもしバグが見つかったら対応に時間がかかりそう。

| | コメント (0) | トラックバック (0)

2008/06/21

天鳳特上卓到達その後

惨敗中。特上東風赤ありで100戦して、20-27-23-30。(負けてるときは画像なしです。)
100戦程度ではなんともいえないけど、いくらなんでも負けすぎ。
東風赤ありを意識しすぎて、打ち方変えすぎてるような気がする。一度普段第2東風とかまったり麻雀とか相手に自分が打ってる打ち方に戻そう。余計なこと気にしすぎて基本的な部分でミスってる気がする。

しかし、やっぱ、東風荘にあるような牌譜集計ツールがほしいな。

ぼちぼちと自分で作ることにしよう。
どうせ、いつか、まったり麻雀を赤ドラに対応させるときに天鳳の牌譜解析ツールを作る必要があるので、まったり麻雀のアップデートと平行して、のんびり作り始めることにする。

今回言語はC#でやる予定。選定理由はWindowsのGUIが作りやすいから。
C#ほとんどまったく知らないけどまあ何とかなるでしょうたぶん。

| | コメント (2) | トラックバック (0)

2008/06/15

天鳳特上卓到達

ようやく天鳳で特上卓に到達。

平均順位2.30、ラス率 0.220とお世辞にも良いとはいえない成績なのに、通算得点7位ってのが必死すぎなのを顕著にあらわしてますな。

ここからが本当の勝負なのですが、このペースで打ってたら作業が進まないので、すこし打つ回数は減らすつもり。


Photo


| | コメント (0) | トラックバック (0)

2008/06/14

エンターテイメントと認知科学研究ステーション第5回講演会

エンターテイメントと認知科学研究ステーション第5回講演会が電通大であったので、行ってきました。

内容はUCTの囲碁への応用の理論編と実践編と5五将棋の自己対戦による学習。

UCTはまあある程度理解できたのですが、5五将棋のほうがいまいち理解できず。
5五将棋ってのは以下の局面から始める将棋のようで、成れるのが1列目だけだという以外は、ほぼ将棋と同じルール(持将棋と千日手は違う?)とのこと。

55shogi


本将棋のようにプロの棋譜が利用できないので、自己対戦での数手先の評価関数を元に評価の重みを調整しているってことがミソらしいだけど……なんかそこがいまいち具体的にイメージできず。正直よく理解できなかった。

例えば、後手1一玉のときの2三銀の価値を学習させるのは、
その数手先までをmax-minで探索して、駒の位置関係だけではなくて、駒割とか玉の安全度とか、すべての要因を使って評価した評価値を使って目先の銀の価値の重み付けを変えているってことなのかな?

要するに、ここで銀をこう動かしておくと、数手先には駒得する(あるいは玉の安全度が高くなる)から、
この銀の位置は評価が高いってこと??

いまいち分からないのは、自分自身で自分を評価してるんだから、
俺様ワールド全開な自己チューな価値観の世界に落ち込まないのか?

そもそもこの評価方法でうまくいくのは学習する前の評価関数が既にある程度強いからだというニュアンスに聞こえた。それに学習前と学習後で強さも比較してないんだから、これが正しいのかどうかさっぱり??

それと1一に後手玉が居るときの先手銀の評価価値の学習結果をスライドで紹介していて、
2四や44の地点の評価が高く、3四の地点の評価が低かったけど、これは、
相手玉との位置関係で評価しているというより、
初期局面から3四銀に上がると、(銀が戻れない&角が動けないので)着手可能数が少なくなってしまうことが影響しているのであって、相手玉との位置関係を評価しているわけではないのでは?

同様に、4四銀もどちらかというと相手玉との位置関係の評価というよりも、
自分の王を守っているということで、ポイントが高くついているだけのような気がするんだけど。

なんだか中盤戦が長く続く大混戦になったら無意味な評価値になるそうな気がしたんだけどどうなんだろう。
(成りゴマができ難いため、盤面が狭い割には意外と長く中盤戦が続くのでは?)


でも、結果を出しているんだからきっと正しいのだろうな。

| | コメント (0) | トラックバック (2)

2008/06/05

0.03%……

1,2手先の局面で高いけど上がりにくい手と安いけど上がりやすい手を選択する時に、残りツモ数の計算方法を間違っている問題を修正した。

しかし計測したけど実際にその差がでる手牌状況はあまりない。しかも、いまのところ、差が出ても期待値が0.03%の差しか無い。

結局また無駄骨か。

でもまあ、プログラムがすこし読みやすくなったから良しということにしよう。

次は、他家挙動が雑すぎる問題を何とかする予定。
どこまで細かく条件分けをするべきかが悩みどころだけど、最初は超大雑把でやってみる。
理屈上では理想より高さより速さ優先になってしまいそうだけれど、今よりは、そこそこ強くなりそうな気がする。

| | コメント (2) | トラックバック (0)

2008/05/27

熱出した

寒かったり暑かったり雨にぬれたりして風邪ひいた。
ついでに傘一本なくした。
それと、腰を痛めた。

| | コメント (2) | トラックバック (0)

2008/05/24

さて次は

とりあえず、孤立字牌は少なくとも今よりは弱くはならないような評価値を返すようにしておくことにして、次の作業にすすもう。
まずは、期待値型評価関数が高めにとりすぎる問題の解決、そして他家挙動の問題、後は牌画のお絵かきをやっていく。

| | コメント (0) | トラックバック (0)

2008/05/22

当たり前の結論

孤立19字牌の優先度程度では、まったくといっていいほど成績に影響が出ない。
すごく当たり前な結論が出た。はあ……最近の評価関数修正は無駄骨ばっかりだな。

| | コメント (2) | トラックバック (0)

2008/05/21

孤立19字牌の価値評価変更中

モンテカルロ・モナコさんの指摘をうけて孤立19字牌の価値評価を確認した、
ソースみたら、公開前に暫定実装したときのヘロヘロなままだった。作業漏れ。
いかんなあ、ちゃんとメモしておかないと……


いくつかの有力な評価関数同士を戦わせてみて一番強いものを採用する予定。

いま自分が最有力と考える新パターンを組み込んだ雀士1人と現バージョン3人とで戦わせてるが、
2000試合で新パターンの平均順位が2.486ぐらい。まだ試行回数が足りなさそうなのでもう少し試してみる。

この評価関数の修正で、掲示板やブログの感想で指摘の多い字牌ドラの扱いも大分マシになると思う。

| | コメント (0) | トラックバック (0)

«天鳳初段到達