« 記号の乖離 B.M.SはB.M.Sに非ず? | トップページ | 記号の魔界 東京芝2400m馬番18は緑の魔界 »

2009年5月10日 (日)

記号の評価 人力評価関数の終焉

Sibaitemcategory200401n20083rd092_3 連休中の興味の中心は競馬ではありませんでした。早稲田大学で行われていた第19回世界コンピュータ将棋選手権(2009)のIT中継をずっと見ておりました。お陰で競馬予想はさっぱりでした。しかし、将棋ソフトの進化は凄いですね。この世界でのブレークスルーは2006年に彗星の如く現れたBonanzaが使用した機械学習という手法ですね。機械学習自身は古くからある手法らしいですが、それを実際に実感(プロと平手で対戦出来る)できるところまでプログラムとして実装できるとは思われていなかったようで、そこで、それまでの機械学習とは区別する為に現在ではBonanza Methodと呼ばれているようです。Bonanza methodで重要な点は将棋の指し手の評価関数(特徴の重み)が自動学習のみで付与されており、人間のソフト作者個人として習得した将棋力(棋力)で付与されていない事です。因みに当時のBonanzaの作者の生身の人間として棋力は殆どゼロに近かったようです。

翌年(2007)は、私としてはBonanzaが優勝すると思っていましたが、棋力の高いソフト作者のソフトに上位を独占されて、Bonanzaは4位に陥落してしまい。さらに、去年(2008)こそは優勝すると思っていましたが、またしても人力評価関数ソフトに敗れてしまいました。そして優勝と準優勝したソフトはトップアマに連勝してしまいました。ただ、この時優勝したソフトの6勝1敗の1敗はBonanzaによるものでした。Bonanzaは3位となりシード権は得ました。そして今年(2009)、当然Bonanzaが優勝となると思いきや、なんと5位に沈みシード権までも失ってしまいました。意外でした。でも、Bonanza methodとしては完全勝利でした。優勝したのは、このmethodを精緻に展開したGPS将棋であった訳です。

今回の選手権では前回優勝ソフトは2勝5敗と大幅に負け越し、過去何度も優勝した事のある人力評価関数ソフトは1勝6敗で決勝8ソフト中6位と7位であった。面白いのは前回準優勝ソフトで、このソフト作者は学習で得られた評価関数をその高い棋力で調整(ドーピングと言うらしい)したようです。今回も期待されていたようですが不参加とされたようです。GPS将棋が優勝した結果から考えると人力では無理と判断されていたようです。Bonanzaの初出場の時は1万近い特徴の重さを自動学習していたそうですが、今回優勝したGPS将棋は2万2千もの特徴の重さを計算したようです。これほどの数になれば、手動で調整する事はいくら高い棋力があっても無理な気もします。

何れにしましても、表題の人力評価関数の終焉はトッププロと対峙できるソフトとしては通過儀礼として迎えなければならないものであり、今回それが起こったようです。しかしながら、特徴の自動抽出などなど(一部には将棋のルールから学習を始めようとする意欲的な挑戦?もあったようです)というのは、まだまだ夢の彼方であり、この部分あるいは教師データの選択など限りなく人知(棋力)が必要である事も確かな事です。

|

« 記号の乖離 B.M.SはB.M.Sに非ず? | トップページ | 記号の魔界 東京芝2400m馬番18は緑の魔界 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/99709/44963661

この記事へのトラックバック一覧です: 記号の評価 人力評価関数の終焉:

« 記号の乖離 B.M.SはB.M.Sに非ず? | トップページ | 記号の魔界 東京芝2400m馬番18は緑の魔界 »