2018年9月に発足した囲碁AI「GLOBIS-AQZ」開発プロジェクト。プロジェクトに関わった機械学習エンジニアの山口祐氏と囲碁棋士大橋拓文六段に囲碁AIでの学習法やAIと人間の関係は今後どう変わっていくのか、経営教育×AIの未来などについてうかがいました。(全2回、後編)
囲碁AIネイティブ棋士の登場
鈴木:2016年以降、囲碁AIネイティブの棋士がたくさん出てきています。2019年7月にGLOBIS-AQZと仲邑菫初段と芝野虎丸九段との対戦がありました。仲邑初段のときは10時間、芝野九段のときは5日間の強化学習で対戦し、いずれもGLOBIS-AQZが勝ちました。
大橋:今回は産総研のAI用計算機、数百基規模での学習でした。10時間の学習のバージョンはプロ棋士が練習すれば勝てるレベルだと思います。2局目に対戦した芝野さんはこのあと史上最年少で名人になりましたね。日本を代表する棋士です。5日間学習したバージョンはほぼ人間を超えているようです。この規模で約1週間やれば、イ・セドル九段と対戦したAlphaGoよりも強いレベルになると言えます。
鈴木:コンピュータが人間を超えてしまうと、ファンが減りませんか。
山口:囲碁ではここ数年の話ですが、チェスやオセロ、バックギャモン、将棋では以前からコンピュータが人間よりはるかに強くなっています。その前例を見ると、むしろ楽しむ人が増えています。加えて、幅広い層の実力が伸びる傾向があり、特にオセロやバックギャモンはそれが顕著です。
それまではアマチュアだと、例えば碁会所などに打つしか方法がなかった。しかし、今はコンピュータに聞けば答えが返ってくる。それによって、かなり人間全体のレベルが上がり、ゲーム自体の面白さを感じる人もいて、プラスに働いていると思います。
大橋:日本は十数年、インターネットを活用した練習で中国、韓国に遅れを取っていましたが、ここからAIを使いこなすことで今後日本が追いつけるかもしれません。
コンピュータの感覚と自分の感覚を合わせる
鈴木:囲碁AIをどのように取り入れているのですか。AIならどう打つのかを先生的に使うイメージでしょうか。
大橋:囲碁AIはまず序盤研究に役立ちます。ピンポイントで「こうやったらこうする」というところを掘って作戦を立てると、有効だと思います。これを半年間やり続けると、かなり効果があるのではないでしょうか。
使い方が難しい点をあげると、囲碁AIがまだまだ途上で、上限に全然達していない点です。これからどんどん強くなる。だからさらに強くなったAIが以前のバージョンと正反対の評価値を出すことも少なくありません。こっちのAIは「黒がいい」と言い、こっちのAIは「白がいい」と言う。そういう局面がしばしばあると、混乱しますよね。そういうところとうまく付き合いつつ、徐々にみんなで活用の仕方を共有していければいいかなと思っています。
鈴木:バックギャモンなどでは、コンピュータを使ってどう学ぶかはある程度パターン化されてきているのですか。
山口:そうですね。基本的にはコンピュータの感覚と自分の感覚を合わせていく作業です。人間が「Aのほうが良さそうだ」「いやいや、Bもそんなに悪くない」と感覚的に言ってきたものが、コンピュータを使うと「こちらは65%で、こちらは55%」とはっきり分かる。それだけではなく、「この局面はこちらのほうが形勢はいい」「いや、これは実は互角だ」など数値で出ます。
エキスパートプレーヤーはそれをすぐ判断できますが、コンピュータと乖離している場合も当然ある。その乖離がなくなるように、コンピュータを使い訓練していくわけです。
鈴木:コンピュータの判断に近い判断ができるように、ということですか。
山口:将棋のプロ棋士だと、コンピュータが出す評価値の数値を、局面を見ただけでかなり正確に言い当てられるそうです。そんなふうに最終的に人間がコンピュータに近づく、そういう学習の仕方になるのではないでしょうか。
鈴木:ある意味コンピュータの判断を正解として、教師あり学習的にむしろ人間が学習していく、と。人間がコンピュータに学習させたのと同じように、学習している。すごい世界観ですね。
山口:これまでは人間のほうが、能力が高かった。例えば、人間が画像で「これは車だ」とラベリングしていたものが、コンピュータが人間を上回ったので、今度は人間がコンピュータベースを学習リソースにする。より正確なほうが、当然先生になる、それが他のボードゲームですでに発生しています。囲碁も今は過渡期にあるかもしれませんが、いずれ収斂していくと思います。
どのボードゲームにも過渡期があって、いろいろなソフト、コンピュータAIがあって、それがどんどん強さがアップデートされていきます。チェスや将棋などは、強いソフトが毎年、下手したら数カ月で変わって、評価が全く逆になるということが頻繁に起こっています。それでもトッププレーヤーはしっかり対応している。評価が真逆になったら、自分の評価も全部真逆に一瞬で修正できる人が結局、勝ち残るのだと思います。
フィードバックがあるかどうか
鈴木:最後に経営教育×AIの未来についてうかがいたいと思います。人間とAIの関係や、人間が学んでいくことに関してのお考えなどを聞かせてください。
山口:私はAIと人間との関係には4つの段階があると思っています。1つ目は人間のほうが、圧倒的に能力が高い状態。2つ目は、AIが強さを増し、人間といい勝負になる。人間と比較するというイコールの時代に入ってきます。3つ目の段階はAIが人間を逆転、その差が広がってくると、今度は人間がAIを参照する。囲碁AIはこの段階と言えます。ここまでくるとAIに大きな進歩はなく、コスト面でペイしなくなってくる。
その次、4つ目の段階が今後大事になってきます。いかにコストを抑えて、かつ人間とうまく学習の循環を回せるかがキーポイントです。今までは一方向的な感じでしたが、これからは人間とコンピュータが双方向に学習できる段階になると思っています。
最終的にはうまく協調して、お互い補い合いながら、より複雑な事象に対してコンピュータも伸ばしていくし、人間自体の能力を高くしていくことにフォーカスが移っていくのではないでしょうか。
鈴木:面白いし、大切な視点ですね。グロービスもそこに貢献できるといいなと思います。大橋さん囲碁の観点から何かありますか。
大橋:同じ局面を見たとき、棋風の違いで、こちらの人は「黒がいい」、こちらの人は「白がいい」という状況がありました。こうしたとき、AI登場以前は思想で戦っていました。でも、今はAIによって数値で「どちらがいいのか」が分かるので、「巻き戻して、どの手が悪かったかを調べよう」と建設的な議論ができるようになりました。「思想の対決としての囲碁の面白さ」は減ってしまったかもしれませんが学習効率は何倍も良くなったと思います。
教育シーンでの活用という意味では革命的だと思います。またAIが示す状況判断を鮮明に可視化できれば、より多くの方に囲碁というものを伝えられるかもしれません。新しい楽しみ方をつくって、囲碁を楽しめる人を増やしたいです。
鈴木:囲碁AIから正解と見なせる状態、あるいは点数という形でフィードバックをもらえるようになったことで、学習が促進されているのですね。実は、今の私たちの経営教育では学習者への個別フィードバックがまだまだ十分ではないと考えているのですが、学習プロセスでは的確なフィードバックが極めて重要だということを改めて感じました。
(文=荻島央江)