今年4月、将棋のプロ棋士と将棋コンピューターソフトが5対5で対戦した「第2回将棋電王戦」は大変な盛り上がりを見せた。そして、その興奮さめやらぬ5月、「第23回世界コンピュータ将棋選手権」に優勝したのは『ボナンザ(Bonanza)』。開発者は「将棋ソフトに革命を起こした」といわれる保木邦仁・国立大学法人電気通信大学特任助教である。第1回電王戦で、故・米長邦雄永世棋聖に勝利した『ボンクラーズ(Bonkras)』が、『ボナンザ』のソースコードをベースにしていたのをはじめ、いまだに「ボナンザチルドレン」は後を絶たない状況だ。そんな保木氏に将棋ソフトの進化と意義についてインタビューした。
- プロフィール
- ほき・くにひと●国立大学法人電気通信大学特任助教。1975年、札幌市生まれ。東北大学で博士(理学)を取得後、トロント大学に理論化学の研究員として在籍していた2005年に将棋ソフト『ボナンザ』を開発。2006年の世界コンピュータ将棋選手権に初出場・初優勝の快挙を達成。2009年には思考ルーチンのソースコードを公開。「ボナンザチルドレン」が多数現れるようになる。今年5月に開催された2013年の第23回世界コンピュータ将棋選手権で見事チャンピオンに返り咲く。
保木邦仁 氏
──将棋は初心者だったということですが、なぜ将棋ソフトの開発を始められたのでしょうか。
保木 2003年にトロント大学の研究員(理論化学)としてカナダに渡ったのですが、向こうは時間の流れがゆったりしていて精神的にも肉体的にも余裕ができたんですね。それで、色々専門外のことにも食指を伸ばしているうちに、たまたまチェスのコンピュータソフト『ディープブルー』の研究論文を目にしたのです。当時の私の専門は、コンピュータを使って電子や原子、分子、化学物質などモノの運動の仕組みを解き明かすことだったので、『ディープブルー』が駒を動かす仕組みに興味が湧いたというわけです。
カナダでチェスソフトに触発
──1997年に初めて人間のチェスチャンピオンを破ったあの『ディープブルー』ですね。
保木 はい。チェスでコンピュータが人間のチャンピオンに勝ったというニュースを、大学に入りたての頃に聞いて「へーすごいな」と思った記憶はあるのですが、もちろん当時はそれっきりでした。でも、10年後にトロントで論文を目にした時には僕もそれなりに科学者としての知識を積み上げており、その内容にのめり込んでしまったのです。そして、ある程度理解できるようになると、今度は自分でもつくりたくなってきました。トロントのゆったり感がそうさせたのかもしれませんね。日本にいたら、時間に追われてまずそんな余裕はなかったでしょう。
──チェスがなぜ将棋に?
保木 チェスはすでに研究が進んでいて優秀なソフトがありましたから。でも将棋はまだまだで、アマチュアのトップクラスと良い勝負をする程度でした。もともとルーツが同じ王様を詰め合うゲームだし(笑)、どうせなら未開拓のものをやってみたいと思って……。
──プロ棋士に勝とうと意気込んで始められたのですか。
保木 いえいえ。最初は良いものができるという気はまったくしませんでした。趣味として楽しかったから続けていただけです。これが仕事だったら、成果がでるかどうか判然としない分野に、大量の時間と労力をかけることはできなかったでしょう。ガンダムのプラモデルをつくるのと同じ感覚ですね。でも、手探りでやっていくうちに思ったよりも強いものができてしまって、ネットの将棋対局サイトなどで腕試しをすると「かなり強いかもしれない」と実感できるようになった。また、ある人の薦めでダウンロードフリーでネット上に公開すると、またたくまに有名になってしまった。そのときにコンタクトのあったソフト会社マグノリアの広沢一郎社長からその年の世界コンピュータ将棋選手権に出てみないかというお誘いを受けたわけです。
──で、2006年の同選手権に出場されなんと「初出場初優勝」を飾られました。
保木 僕はカナダでしたので広沢氏に代わりに操作してもらいました。ラッキーだったですね。トップクラスのソフトと実力的には同等だとは思っていましたが、勝ったり負けたりで優勝は無理だろうと考えていましたから。
──お一人で、開発期間もたった半年で、それなりに開発の歴史のあるトップクラスのソフトと並ばれたというのは優勝以上にすごいことなのでは?
保木 確かに、将棋ソフトは個人でしかも半年程度で開発できるものではなかったようです。私が将棋の素人で、まったくの部外者だったということが、常識にとらわれない新しい簡潔な方法論を生み出すことにプラスに働いたのかもしれませんね。
しらみつぶしに手を読む
──さて、その方法論ですが、『ボナンザ』の革新性の第一には「力づく探索」が挙げられます。
保木 『ディープブルー』は基本的には「力づく探索」なんですね。私はその影響を色濃く受けているので、この方法論を採用しました。一方、従来型のソフトは将棋の知識を利用して手を絞り込むことに重点を置いたいわば「選択的探索」だったようですが、私はカナダにいてそのこと自体もあまり知りませんでした。知らなかったからこそ違うアプローチができたのでしょう。ちなみに力づく探索とは文字通り、しらみつぶしにすべての手を探索し、そのなかから正解手を選ぶという手法です。
──「力づく」で読むわけですから、人の思いつかないまったく新しい手を探し出すことができると。
保木 ざっくりいうとそういうことになります。いわば「広く浅く」という感じでしょうか。対して、従来型の絞り込み重視のソフトは「狭く深く」といえます。
──しかし、その後はチェスのような力づく探索の優秀性が将棋でも認められるようになっていくわけですね。どうしてそれまでは流行らなかったのでしょうか。
保木 当時のコンピュータの計算性能の低さを理由に挙げる人もいますが、どうでしょうか。あるいは人間プログラマーの直感が邪魔をして……との意見もあります。ただ、力づく探索に真剣に取り組むのは簡単なことではありませんから、私としては、それまで挑戦する人がいなかったとしても不思議ではないなと思っています。
──それから、『ボナンザ』でもう一つ画期的だったのが、人工知能分野でさかんに研究されている「機械学習」という手法を採用したことだったと聞いています。
保木 はい。機械学習とはコンピュータ自身が学んでいく自動学習のことで、力づく探索によるしらみつぶしの手法に「命を吹き込む」作業でした。機械学習は従来の将棋ソフトでうまく活用されている例を見つけることができなかったので、僕はそこに本業で研究していた制御理論(化学反応制御)を持ち込んでみました。
──とても難しい話になりそうですね(笑)。
保木 単純化していうと、大量のプロ棋士など強い人の棋譜を入力し、その棋譜と同じような手を指せるように一手ごとの「評価関数」(有利・不利の度合い)を自動調整する仕組みです。棋譜の数は約6万件にも及び、古いものでは江戸時代、1607年にさかのぼる棋譜まで入力しました。これが、「『ボナンザ』の指す手は人間の感覚に近い」と言われるゆえんなのかもしれません。もちろん力づく探索によって生じる大量の手の「枝刈り」の工夫は機械学習だけではなく「アルファベータ法」や「ナルムーブ法」など多数施してあるのですが……。
──難しすぎるのでその話は後日(笑)。さて、2006年のコンピュータ選手権の優勝の翌年、トップ棋士である渡辺明竜王との対戦が実現。おおかたの予想に反して、大接戦でした。
保木 経緯の詳細は忘れてしまいましたが、ある日突然オファーが来たので気軽に「はい」と応えました(笑)。当時はまだ、私も世間一般もプロ棋士の方がコンピュータよりもかなり強いと思っていて、渡辺竜王にもそれほどの気負いはなかったように思います。
人間の思考の奥深さ
──保木さん自身、プロ棋士には、どんなところがかなわないと思っておられたのでしょうか。
保木 いまでもそうですが、人間、とりわけプロ棋士の思考プロセスは「よく分からない」というのが正直なところでした。たとえば、「駒の連携が重い」「手厚い」「ひと目寄り筋」などといわれても、私自身将棋が弱いので意味がよくつかめないし、もちろんその評価尺度をどうソフトに入れ込むかも分かりません。なので、到底勝てないと……。
──よく言われる「大局観」ということですか。
保木 そうかもしれません。要するに、コンピュータに何が足りないのかと言われても「よく分からない」としか応えようがないのです。たくさんありすぎて……。そもそも人間とコンピュータでは長所と短所が違います。たとえば、長所でいえば、人間は長期的なプランを持って駒を動かしますが、コンピュータはその場その場でどこのマスに動かすのがベストかを考える。
──長期的なプランとは?
保木 何かぼんやりとした方向性とでもいいますか……。プロ棋士はそうした漠然としたものに基づいて将棋を指しておられる。そして勝ってしまうのだから、理解不能です。
──逆に短所は?
保木 人間とコンピュータの比較は僕の専門ではないので適当に言わせてもらうと、短所の場合はより明らかです。当たり前かもしれませんが、人はうっかり間違うのに対し、コンピュータにはそれがないことです。うっかりとは、たとえば一手詰めとか二歩とかの見逃しですね。
──2009年には、『ボナンザ』の思考ルーチンのソースコードを公開され、関係者に衝撃を与えました。2012年の第1回将棋電王戦で、米長邦雄永世棋聖に勝った『ボンクラーズ』も『ボナンザ』をベースにしていたとか。
保木 はい。そのようです。ソースコードの公開は『ボナンザ』開発の一応の締めくくりという意味でした。それが将棋ソフトのさらなる進化に貢献できたとすればうれしいです。ちなみに、2012年の世界コンピュータ将棋選手権では6チーム、2013年の大会では9チームが『ボナンザ6.0』のライブラリを採用していたようです。
コンピュータは人を超えたか
──ところで、先の電王戦ではコンピュータが3勝1敗1引き分けと勝利しました。率直に言ってコンピュータはプロ棋士を超えたと思われますか。
保木 それは分かりませんが、僕はまだじゃないかと。
──なぜでしょう。
保木 まず言えるのはデータが少なすぎます。チェスにしても最初にディープブルーが世界王者に「勝った」とされた時の成績は2勝1敗3引き分けという微妙なものでした。その後も互角の競り合いが6、7年は続いたように思います。将棋にしても人とコンピュータの競り合いは始まったばかり。しかも、チェスの理論上の探索空間の大きさは10の120乗なのに対して、取った駒を使える将棋は10の220~260乗。圧倒的に将棋の方が複雑なのです。つまり、その分だけソフト開発が難しいということですね。だとすれば、今後も互角に近い競り合いがしばらくは続くのではないでしょうか。
──コンピュータには「入玉戦法(王や玉を相手陣地に入り込ませ、詰みにくくする戦法)に弱い」という点も指摘されています。
保木 『ボナンザ』も例外ではありません。その最大の理由は入れ込むべき過去の入玉の棋譜データが少ないからです。これ以外にもコンピュータには明らかなくせや弱点があります。人間がそれらのくせを徹底研究し、どんどん発見するような状況になれば、再度、コンピュータはプロ棋士に勝てない時代が来ないとも限りません。
──一方で、将棋ソフト開発者のなかには「コンピュータは名人を超えた」と豪語されている方もおられるようです。
保木 超えたのかもしれませんし、超えてないのかもしれない。これは分からないとしか言いようがありません。分かるためにはどんどん対局を行い、結果を積み上げること。そうすれば徐々にはっきりしてくるということでしょう。少なくとも5戦では分かりません。ただ、いずれコンピュータが人を超える時がくるというのは間違いないと思います。
「遊ぶ」ことが大発明を呼ぶ
──ところで、将棋というゲームでコンピュータが人を超えるという現象の意義はどこにあるのでしょう。
保木 難しい質問ですが、間接的には大きな意味を持ってくる可能性があるでしょう。人間にしかできなかったことをコンピュータができるようになれば、人々のコンピュータに対する意識が変わります。人工頭脳的意味合いで、コンピュータがどこまでできるのかという領域が徐々に広がっていく。そのことを人々が認識することに、まず意味があるのだと思っています。「コンピュータが将棋で人に勝って何の意味があるんだ」と考える人もおられるでしょう。でも、アポロ11号の月面着陸だって、無意味といえば無意味ですが、間違いなく人類の偉大な一歩だったし、宇宙開発の過程で生まれた多くの技術は、われわれの社会生活にも応用されています。また、たとえば電子レンジは、ある技術者が、通信時にマイクロ波が発生する環境のなかでポケットに入れていたクラスターバーが溶けていたことから着想されました。偶然から予想外の製品が産み出されたのです。現在でいえば、量子コンピュータなども巨額の資金を費やして国レベルでさかんに研究されていますが、直接的に何の役に立つのか良く分かっていません。ようするにある基礎技術が、その後どのようなものに応用されるかは実際には想像もつかないことが多いのです。
私は、多くの場合、何の役に立つか分からないものを対象に、研究者が「遊ぶ」ことで将来のブレークスルーや画期的製品が生まれるのではないかと考えています。「まずマーケティングありき」の製品開発では、大発明・大発見は望めないのではないでしょうか。その意味で、『ボナンザ』に組み込んだアルゴリズム、あるいは進展著しい将棋ソフトの開発技術そのものが、将来きっと何かに応用されると確信しています。
──来年、もし『第3回将棋電王戦』があるとすれば、大将格での出場になりますね。
保木 さあどうでしょうか。出場を打診されれば断る理由はありませんが、自分でスポンサーを募るほどの興味はありせん。実は最近、私の本業としての研究対象も、化学から「思考ゲーム」へと変わりました。趣味が高じて……という感じですね。それだけに、もっと強い、神のようなソフトをつくりたいという欲求はありますし、『ボナンザ』がさらに強くなる技術や方法を新しく発見できればいいなと思っています。
(インタビュー・構成/本誌・高根文隆)