« 2008年7月 | トップページ | 2008年9月 »

2008/08/31

マイナス×マイナスがプラスになるように

マイナスxマイナスがプラスになるように、個々の欠点同士が妙にバランスとれあってプラスに働くことがある。

プロ野球の落合監督の現役時代(アマチュア時代?)の場合について本でよんだことがある。
彼は背骨が右に傾いている、アッパースイングなどの欠点があったそうだ。それらは個々にみれば欠点だけど、トータルでみれば、バランスが取れていたともいえるそうだ。右バッターで背骨が右に傾いている場合、アッパースイングのほうが軸の回転は高速で正確なスイングが可能となるらしい。

一つの欠点を直そうすると、バランスが崩れて全体として弱くなるということがあるから、指導者としてプレイヤーの欠点を指摘し矯正する場合はここのプレイヤーの特性を見極めた慎重な考慮が必要であるということらしい。

危うげな詰み方なのに全体としては微妙なバランスをとって崩れずに詰みあがっている積み木塔の一箇所だけきっちり詰みなおしても全体としてはバランスがかえって崩れてしまい積み木が倒れてしまうようなイメージなのだろう。

麻雀や将棋にもそういった、微妙な欠点がバランスでなりたっているものがあるのだと思う。それがたぶん、ゲームAIで言われる局所解や、プロ将棋の棋士の棋風なのだと思う。

私が今作業している、新アルゴリズムのほうが弱いのも同じようなケースなのかもしれない。

現行のアルゴリズムより、新しいアルゴリズムの方があきらかに、部分的には正解に近いけど、実際プレイさせてみると、現行版のほうが強い。


これはどう対処したらいいのだろう。個性として認めてそのままにしておくべきか、いっそのこと全体のバランスを一斉に見直すべきか。判断はかなり重要な岐路になりそうなんで、もう少し色々慎重にしらべてから決断を下すようにしたい。

| | コメント (3) | トラックバック (0)

2008/08/25

まだ弱い

先日見つけたバグを修正して5300試合比較したが、それでも古いアルゴリズム方がRで40ほど強い。
何が原因なのか、まだバグがあうのかもう少し調べる。
それと熱出した。ここ2,3年やたら体壊すようになったな。

ガキの頃から体弱いほうだし、もう若くはないけど、それにしても最近はひどい状態。

| | コメント (5) | トラックバック (0)

2008/08/24

天鳳でデュプリケート機能?

http://tenhou.net/announce.html

どうなるでしょうね。
まったりでやった感想としては、デュプリケートでも、やはりある程度回数こなさないと優劣はつけられない感じがする。

けれど、優劣ではなくて、雀士毎の棋風(雀風?)は割と半荘1,2回程度の割と少ない回数で判明する。
優劣を競うんでなくて雀風を確認する意味では有意義だと思う。


| | コメント (2) | トラックバック (0)

2008/08/23

バグ発見

新アルゴリズムバグ発見。

順目毎の他家挙動の確率モデルを残りツモ数で計算してた。結果、終盤ほど相手が聴牌してる確率が低いって計算してた。新アルゴリズムは、計算高速化のため、今まで1順目から計算していた箇所を、18順目から逆に計算するようにしたんだけれど、そこで修正漏れがあった。

どうもこれが旧アルゴリズムより弱かった原因くさい。
全ツッパ状態で、新旧アルゴリズムでデュプリケート対局で比較しているけれど、1050試合時点でほぼ互角。

もう少し試験回数増やしてみる。
その語、実際目で打牌の差を比較してみる。
問題なさそうなら、押し引きアルゴリズムを有効にして試験してみる予定。

| | コメント (0) | トラックバック (0)

Bフレッツに乗り換え

まともに、ADSL回線がつながらない状況がずっと続いていたので、光に乗り換えた。
今のところ結構安定している。ただ、無線LANの部分がネックになっているので体感速度はそれほど変わらず。

| | コメント (0) | トラックバック (0)

2008/08/20

試し打ち

コンピュータ同士で対戦させているけれど、夏場に長時間CPUフルで動作させるのは熱暴走しそうで結構不安。

| | コメント (3) | トラックバック (0)

一つずつ潰していこう

孤立牌評価関数はどうも手広く受けすぎているのが敗因の模様。もう少し探ってみる。

牌効率部はいくつかバグがあった模様。ただそれを修正してもまだ弱い。新旧のアルゴリズムの打牌を比較しながら地味に原因を探っていくことにする。

| | コメント (0) | トラックバック (0)

2008/08/15

分からない……

デュプリケートモード1700試合程プレイさせて比較してみたけど、どうも古いアルゴリズムの方が強そうだ。

新しいアルゴリズムのほうが麻雀の仕組みをより忠実に再現してるはずなんだけど。
もう何が悪いのかさっぱり分からない。

個々の打牌の違う状況を目で見て確認しても、私程度の雀力では「どっちでそんなに違わないのでは?」という印象しかない。

新旧のアルゴリズムで、変えた部分は、以下の3箇所。

1)牌効率(ロンの扱い、他家挙動、七対子)
2)孤立牌評価
3)押し引き判断

なにがわるいのかパーツ毎に比較してみた。

牌効率部

まずは、全ツッパにしてみて牌効率だけ新旧アルゴリズムで比較したが、
それでも旧アルゴリズムが強い。

理屈からいって旧アルゴリズムのほうが他家の和了を警戒してる分、
早い手をつくるはずなんだけどなぜかそうならない。
ロンの扱いも新アルゴリズムの方が正確なはずなんだけど……

=>七対子のとの統合に問題があるのかもしれない。
ロンの扱いについて調査する方法を考える必要がある?
七対子の意識下げてみる?
対子なしルールモードを付くって新旧比較してみる?


孤立牌評価部

孤立牌の比較もやってみたけど、これも旧アルゴリズムの方が強い。
ウーン。
これもどう考えても新アルゴリズムの方が効率がよいはずなんだけど……

=>危険牌を無駄に抱えすぎてるってことなんだろうか……
順目がすすんできたら、手替わりの広さより安全を重視するように修正してみる?


押し引き部
まだ未評価だがこれも古いほうがよいようだが、よくわからない。
ただこれはデータの修正で微調整が効くはず。

| | コメント (4) | トラックバック (0)

2008/08/10

とりあえず出来た

他家挙動の見直し(第一弾)、チートイモード、ベタオリモードを統合した評価関数の作成作業がとりあえず終わった。
ためしに、打たせてみてみると、基本的にはそれほど前と変わってないけど、早さ重視で&押し引きが攻撃的になった印象。
っていうか、いくらなんでも押しすぎてる気がする。

今後旧アルゴリズムと対戦させてみる予定。もし仮に旧アルゴリズムより弱かったとしても、アルゴリズム自体は残してデータを調整するようにするつもり。
公開はまだ当面ない予定。GUI周りの修正とあわせてから公開したい。


ここからドラの5索切って押しと判断してるけど…
1_2


| | コメント (0) | トラックバック (0)

ネットワーク回線不調

なぜか分からないけれど、自宅のADSLが不調で殆どつからがらない。
どうもルータがおかしい感じ。ごくまれに調子よくなるけれど、大半はまったくアクセスできない。

ネットの暇つぶしを減らして、まったり麻雀の開発に時間を割けという神の意思と思うことにする。
しばらくメールやBBSの返答も出来ないかもしれませんがご容赦を。

いい機会だから光ファイバーに乗り換えることにします。

| | コメント (0) | トラックバック (0)

« 2008年7月 | トップページ | 2008年9月 »