人工知能のディープラーニングって、何がすごいの? 

  • このエントリーをはてなブックマークに追加
  • このエントリーをはてなブックマークに追加

人工知能は日本企業の好機となるか ~ディープラーニングが変える社会~[1]

木村尚敬氏(以下、敬称略):人工知能(AI)は政府の日本再興戦略でも「IoT・ビッグデータ・人工知能による産業構造・就業構造変革の検討」ということで議論され、成長戦略におけるひとつの鍵とされている。ただ、私の感覚で申し上げるとAIやビッグデータは相当幅広く捉えられていて、皆さまの理解レベルにも差があるように思う。また、それが現在の話なのか、もうすぐ起こる明日の話なのか、さらに先の話なのかといった時間軸もごちゃっとなって、今はそれらすべてが一緒くたになっているとも感じる。そこで、「実際、どうなの?」と。まずは皆さんの認識を整理していただくことも踏まえて議論を進めたい。今日はこの分野で最先端を走るテクノロジーエッジな御三方にご登壇いただいたので、面白い話が聞けると思う。まずは武田さん。現在、AIをどのように使い、どういったビジネスをなさっているのだろうか。
 

武田秀樹氏(以下、敬称略):我々は人工知能を用いたテキストデータ解析に特化して、機械学習と自然言語処理の技術を使ったオリジナルのアルゴリズムをつくっている。それによって、主に膨大なメールや社内報告書のなかから国際訴訟で使われる証拠を発見するために人工知能を活用している、という形だ。現在はその技術で電子カルテの解析やビジネスインテリジェンス、あるいはデジタル・キュレーションといった領域にも応用範囲を広げつつある。

木村:AI導入前の国際訴訟ではどんな風に証拠を探していたのだろう。

武田:ひたすら人間が見ていた。弁護士の方がたくさん集まって、何万~何十万件、あるいは何千万件というドキュメントを読み込んでいた。

木村:たとえば弁護士の方々が20名ほどのチームになって、それこそすべてのメール履歴に目を通して、怪しいキーワードも“人間技”で探していた、と。

武田:そう。100~200名のチームなんていうのもザラにあった。

木村:では、続いて森さん。楽天ではどのようにAIを活用しているのだろう。

森正弥氏(以下、敬称略):私は今、楽天で研究している先端技術を実際のビジネスにショートタームで生かし、「結果を出すためにどうするか」といった領域を役員として担当している。楽天技術研究所の拠点は、東京、ニューヨーク、ボストン、パリ、そしてシンガポールの5箇所にある。そこで、たとえばO2O(Online to Offline)と言われるような新しいサービスを実空間に拡充させる研究や、最先端の画像認識をEコマースに生かすかための研究を行っている。そこに人工知能や機械学習、そして最近話題となっているディープラーニングの専門家も集めている状態だ。そのうえで研究成果を実際のマーケティングに生かすといったことをしている。

木村:続いて松尾先生。概念整理も含めてAIの進化をご説明いただきたい。

松尾豊氏(以下、敬称略):人工知能の分野は1956年にできたので来年で60歳。コンピュータができた約10年後には生まれていた。で、コンピュータは計算が速いからどう見ても頭がいいということで、「この勢いで人間の頭脳もあっという間に追い越すのでは?」と、1950年代当時から思われていた。ところが人間は案外賢くて、なかなかコンピュータで実現できない状態がその後60年続く。その間にAIブームは何回か起きていて、今はその3回目だ。初期の10~20年間が第1次AIブームで、実はこのときにかなり革新的な技術が次々生まれた。当時すでに医療診断をするようなAI、定理の証明をするようなAI、チェスを指すAIといったものができている。

そうして第1次AIブームでは計算を速くして探索することで知的な仕組みを実現しようしたわけだけれども、それでは現実的な問題になかなか適用できなかった。パズルを解くことはできても現実問題が解けない、と。それで、第2次AIブームでは「知識をたくさん入れたらいいでしょ」となり、知識を入れた「エキスパートシステム」というものが数多くつくられていく。ところが、知識を“入れきる”ことが難しい。どうやっても例外が生じたり、状況が変化するとうまく動かなくなったりするということで、これも限界があるということになった。

そうした状況を経て、現在はビッグデータやウェブのデータが増えてきたことによって機械学習の技術がさまざまなシーンで使えるようになってきた。今は検索エンジンやウェブサービスのかなりの部分で人工知能および機械学習の技術が使われている状態だ。また、そのなかでディープラーニングという新しい技術も出てきて、今は3回目のAIブームを迎えているという感じだと思う。

木村:ビジネスでも大量のデータを分析すること自体は1990年代頃から行われていた。たとえばウォルマートが大量の顧客データを分析したところ、週末はオムツとビールの売上に高い相関性が生じると分かった、と。それで売場にその2点を並べたら売上が伸びたという例もある。ただ、それは人間がデータに指示を出して、それにコンピュータが返してくれる世界だった。そうした世界と、先ほどからお話に出ている機械学習とのあいだの飛躍感というか、技術的ジャンプはどんなものなのだろう。

松尾:実はそれほど大きなジャンプはない。「ビールを買う人はオムツも買います」という相関ルールの発見は、基本的には機械学習による予測の仕組みとしても使えるので。1990年~2000年代にかけてデータマイニングや機械学習の技術が着々と進んできて、いろいろな場面で使われるようになってきていたという話だと思う。

ただ、皆がそれを人工知能と呼んでいなかった。なぜ今人工知能と呼ぶようになったかというと、学習結果を使ってリアルタイムにメールを配信したり広告を打ったりするようになったから。リアルタイムのアクションが生まれると、なにかこう、状況に応じて考えてすごいことをしているように見えるので。知能というのは…、これは生物の知能も同じで、環境から情報を取ったうえで考えて行動するし、行動になって初めて知能という感じがする。AIも同じだ。データ分析に留まっていると知能という感じがあまりしない。でも、分析次第でメールや広告の中身が変わるとなると、「それ、知能っぽいね」と。それで今は人工知能という言葉がキーワードになっているのかなと思う。

木村:その辺も踏まえつつ、改めて武田さんに伺ってみたい。人工知能を使ってテキストデータの解析を行うと具体的にはどんなことができるのだろう。

武田:国際訴訟では一定の時間内に証拠を見つけなければいけないというレギュレーションがある。それで訴訟に関連すると思われるメールやドキュメントを探すわけだ。具体的には、たとえばカルテル関連訴訟なら競合に価格を教えたり示唆するようなテキスト。この場合、最初にサンプルとして弁護士が調査したものを元に機械が学習を行って、その後、残りのたとえば数百万件というデータを人工知能に判断させる。これはスコアリングを用いる。そのようにして判断させたあとに人間の弁護士が答え合わせのようなことを行うと、人間だけでやるよりも圧倒的に作業が速くなる。

木村:いわゆる「教師あり学習」というものだろうか。

武田:そう。教師がいる。

木村:楽天さんのほうはどうだろう。

森:テキスト理解は大変分かりやすい人工知能のアプリケーションだ。で、そこでは単純に言葉を分析するのでなく、そこから最も決定的な言葉を抽出したり、その人がその言葉をどんな意味で使ったかを理解したりすることが重要になる。最近はそうした技術がかなりコモディティ化してきた。たとえば楽天市場にはお客様が商品を評価するレビュー機能があるけれども、我々はそのレビューを評価する技術をつくった。レビューには商品に対する高評価も低評価もあるが、その評価よりも重要なのが、書いた方の、いわば“本気度合い”。それを単純な文字の羅列で判断するのでなく、「本気の価値観から書いたこだわりのあるレビュー」を判断・抽出し、思いのこもったレビューということでユーザーに見せる。そういうことを今年からやっている。

で、これだけを言うとインパクトがあり過ぎるけれども、その結果、流通総額が100億増えた。レビューに書かれた言葉の理解だけでそうなるわけだから大変なインパクトだ。これは単に言葉のデータを解析するというだけの話ではない。テキスト解析というのは工夫すればビジネスにダイレクトな影響があるということだと思う。

木村:映像のレンタルやストリーミングを行うNetflixも、そういった分析技術を使って飛躍的に伸びたという話を聞いたことがある。

森:Netflixはだいぶ前からデータを用いた顧客理解を進めていて、いかに商品を薦めるかということをすごくやってきている。いわゆるディープラーニングを用いて小売で大きな効果につなげたという成功例も報告されたりしているので。

松尾:「本気度を分析すると売上増になる」という部分をもう少し伺いたい。

森:ユーザーは商品を購入する際、スペックだけでなく、他のユーザーがどんな風にそれを使い、その結果としてどんな評価をしたか、良いも悪いも含めて知りたいと思っている。たとえば高度なデジタル機器のように複雑で入り組んだ商品なら特に、「これは良かったです。前から買いたかったんです」程度でなく、「こう使ったらこうなって、友達にはこんな風に喜ばれました」といった話が知りたい。商品に対して低評価であっても高評価であっても、ともかくそうしたレビューを「質の高いレビュー」として抽出していく。そうすると、後に続くユーザーの意思決定を促しやすいという効果がある。そうしたレビューを上に表示していったという形になる。

松尾:そうすると購買も増えるという。

森:レビュー経由の購買が増える。

ディープラーニングって何がすごいの?

木村:ここまでの議論でも、本セッションの副題にある「ディープラーニング」という言葉が何回か出てきた。今までの例はどちらかというと従来から続く連続的進化のなかにあったものだと感じるが、改めてディープラーニングについても松尾先生にご説明いただけたらと思う。これ、一体何がすごいのだろうか。

松尾:一言で表現するのは難しいけれども、ここで言う「ディープ」とは深いタイプのニューラルネットワークということ。ニューラルネットワークとは人間の脳神経回路を模擬したような人工知能の手法だ。「人間の脳は深い多層構造をしているから、ニューラルネットワークも深い構造にしたほうがいいだろう」と、皆が考えていた。ところが実際に階層を深くすると精度が落ちてしまってうまく動かない。そんな状態が数十年続いていたという経緯がある。

しかし、ある手法を採用すると階層を深くしても精度が落ちないと分かってきた。それで最近は深いニューラルネットワークを使った研究が次々となされるようになってきていて、その結果として画像認識がある。画像として映っているものが何かを当てるわけだ。コーヒーカップなのか、ペットボトルなのか、猫なのか、あるいは犬なのかといったことを当てるようなタスクの性能がめちゃくちゃ上がってきた。

人間は子どもでも何かを見たときにそれが猫や犬だと分かるし、そこは絶対に間違えない。コンピュータは何十年ものあいだそれが分からなかったけれども、それが今は変わってきた。2012年頃から大変な勢いで画像認識の精度が向上し、今年2月の時点では人間の精度を超えるところまで来ている。それまでは何かを見たとき、そこに何があるかを判断・認識したり、何か変なことが起きていると理解することがコンピュータにはできなかった。では、それができるとどうなるか。たとえば交番の前に警官の方が立っているのは変なことが起きていないかを見ているから。従来、これは人間にしかできなかった。だから警備員が見張ったり、工場の生産ラインでも最後はすべて人間が目視で傷の有無を確認したりしていたわけだ。

それがコンピュータでも可能になると、次は「行動の習熟」が起きる。「この状況でこうするとうまくいく。こうするとうまくいかない」といった判断ができて、やり方がうまくなる。今まで、機械やロボットは一定のやり方で続けるしかなかった。人間なら椅子の組み立てでも果物のカットでも、同じことをしているうち徐々にうまくなる。人工知能にはそれができなかったが、今後は可能になる、と。椅子を組み立てていくうち、組み立て方がうまくなる。そして、ひとたび上手になればそれをコピーすれば高性能な組み立て機器もできる。そんな世界が訪れるのではないかと考えている。

木村:従来の機械学習と異なる点として、ディープラーニングではどこに特徴があるかという特徴量を自動的に学習するという理解をしていた。

松尾:それが一番大きい。自動的に変数を見つけることができる。

木村:武田さんはディープラーニングのどんな点に注目しているだろうか。

武田:我々は自分たちでアルゴリズムをつくっているけれども、全体的に見れば人間が今までやってきたことの置き換えが各分野で進むと思う。たとえば、訴訟で証拠を発見するというビジネスの発展形として、不正等を事前に発見するという活用法がある。今までは、何かの不正等が起きてからその証拠や原因を探したりしていたわけだ。でも、たとえば日々流れるメールのコミュニケーションを機械に監査させ、不正が起こりつつあるならその過程で見つけるといったことをもうはじめている。ビッグデータというと、「あらかじめストックされている巨大なもの」というイメージがあると思う。でも、まさに今生成されつつあるというフローなデータのなかから何かを発見し、リスクをミニマイズするという活用方法もあると思う。

木村:今、重要なご指摘があった。時間軸を見ると、ディープラーニングで先ほど松尾先生がお話したすべてのことは今すぐ実現するわけでもないんですよね。

松尾:0歳児からはじまっていくので、今は認識ができて運動の習熟が若干できるという状態。人間にすると1歳か。言葉を覚える前ぐらいになる。

木村:つまり、今はまだ従来の機械学習によるテキストデータ分析で、人間がある程度変数を入れたほうが効率的かつスピーディーに動くというところだろうか。

武田:まずは人間がある程度の答えを出しておいて判断の特徴を学ばせる。なんというか、人間の暗黙知のようなものを使う。今までの人工知能ではそこを形式化したうえで組み込んだりする必要があった。今後は暗黙知を暗黙知のまま使えるわけで、そういったところは今までとまったく違う。

あと、我々のエンジンは少数のデータを解析しても相当に良い答えを出す。世の中のデータは最初からきれいにラベルが貼られたようなものばかりではない。また、「人工知能を使って解析がしたい。でも、『データが100万件必要です』と言われたから、それならいいやという風になっていた」といった話はよく聞く。でも、我々のエンジンでは少しのデータでもはじめることができて、かつデータ解析自体は有用なものが多いから、どれだけ現実の世界で使えるかということが非常に重要なのだと思う。

木村:楽天さんはディープラーニングでどんな取り組みをしているのだろう。

森:言えないこともあるので、なにかこう、謎かけみたいな話になってしまうが、たとえば先ほど「ディープラーニングで猫を猫と認識できる」といったお話があった。そのポイントは、我々が答えを分かっているから、猫の認識に関しては「あ、なるほど」という風になるということだ。実はそこに重大な意味がある。我々が何か分かっていないものに対しても、実は機械がそれだけの精度を出しているということだ。

たとえば、我々が大量の顧客データを持っていたとする。そこでディープラーニング…、各種機械学習の手法でもいいけれども、たとえばディープラーニングをさせて、「これぐらいの精度が出る」と分かったとする。それは自分たちが顧客データを持っているから正解が分かるわけだ。でも、自分たちが顧客データを持っていないターゲットに関してディープラーニングをさせたらどうなるか。自分たちが分からないだけで、同様の精度は出ている可能性がある。

これが何を意味するのか。自分たちがデータを持っていない顧客にリーチできるということで、これは非常に重大だ。…ちょっとここで止めておいていいですか?(笑)。ここから先は少しまずい話になっちゃうと思うので。いずれにせよ、マーケティングにおけるディープラーニング活用のなかで、恐らくは今後、従来のマーケティング概念を覆す話が出てくると僕は考えている。

→人工知能は日本企業の好機となるか ~ディープラーニングが変える社会~[2]は12/18公開予定

※開催日:2015年11月3日

関連記事

名言

PAGE
TOP