NHKスペシャル「AIに聞いてみた~」から因果関係と相関関係を考える 

  • このエントリーをはてなブックマークに追加
  • このエントリーをはてなブックマークに追加

7月22日に放映された「NHKスペシャル AIに聞いてみた どうすんのよ!?ニッポン」という番組が反響を呼んでいます。番組からの提言の一つとして、「40代ひとり暮らしが日本を滅ぼす?」という刺激的なキャッチフレーズが大いに注目されたようです。

同番組では「人口動態や介護、医療、格差、消費など様々な社会を映し出す5,000を超える公共のデータ」について「複雑に、間接的に影響し合っているそれぞれのデータの関係性をAIが解析」(番組ホームページより)し、日本の社会構造を分析。冒頭のフレーズは、その結果分かってきたことの一つです。

今回、同番組が取り組んだような、大量のデータを集めて相互の関係性をコンピュータで計測するという試みは、既に広く行われています。初期の頃によく紹介された事例は、あるスーパーの売上を分析したところ「ビールが売れるとき、紙おむつも売れることがわかった」というものです。

この話のポイントは、「人間がちょっと思いつかないような関係を、コンピュータなら発見できる」という点です。スーパーで扱う全品目について「ビールと売上がよく連動する品は」と一つひとつ調べていくのは相当な手間ですし、効率的にやろうとすれば、「食品というジャンルの中で調べよう」と重点を置く範囲を予め絞ったり、ビールと一緒に売れる可能性が高いのは「(おつまみにするから)スモークチーズかな」とか「(暑いということだから)アイスかな」と仮説を立てて検証したりとなります。ところがコンピュータなら、人間では到底処理不可能な大量のデータを短時間で処理でき、また、人間にありがちな先入観の壁がないことで、「紙おむつ」という一見意外なアイテムを指摘できるというわけです。

その後、ネットサービスの普及やモバイル通信環境の改善などにより、上記のような分析をする際にコンピュータに入力できるデータの種類・数が飛躍的に増加していきます。「ビッグデータ」といった言葉を耳にしたことがある方も多いでしょう。そこでよく紹介された事例としては、あるティーンの少女宛にベビー用品のクーポンが届きます。少女の親は「こんなものを送ってくるな」とクレームを入れたのですが、実は少女は妊娠していた。過去の購買履歴が妊娠初期の女性にありがちなパターンと類似していて、親でも気づかなかった事実を予測されてしまった、というものです。

先の「ビールと紙おむつ」の例では、まだ人間が現場で感知することもできましたが、いよいよ人間の観察力、想像力ではカバーできない関係もコンピュータなら予測できる、いわば「風が吹けば桶屋が儲かる」の「風」と「桶屋」のかけ離れ度合がどんどん広くなっても予測できるようになっていることを示すエピソードです。

番組で行われた分析も、スケールは違ってもおよそこのような分析の延長上にあるものと言えそうです。ここで「40代ひとり暮らし」と「日本が滅ぶ(ような様々なネガティブな社会統計)」の間には、あくまでも相関関係があると言っているに過ぎません。番組内でもそうした説明はあったのですが、「40代ひとり暮らしが日本を滅ぼす」という表現だと、明らかに「40代ひとり暮らし」が原因で「日本が滅ぶ」という結果をもたらす、という因果関係を前提にしたものと受け取れてしまいます。ここは、番組側の勇み足と言えるでしょう。

一般に、「Aが起こるとき、しばしばBも起こる」という相関関係があるからといって、「Aが起こることが原因でBも起こる」という因果関係もあるとは言い切れません。たとえば、以下のようなケースが有りうるからです

・因果が逆で「Bが原因でAが起こっている」(時間的順序)
・別のCという要因があって、それがAにもBにも影響している(第三因子の影響)
・単なる偶然

これらの可能性をつぶして初めて、因果関係がありそうだと言えるのです。しかし、単純に大量のデータを入力して相互の関係を見るというアプローチを取るだけでは、こうした検証は難しいでしょう。

それでは、因果関係が証明されない限り、分析結果は役に立たないかというと、実はそうでもありません。「ビールと紙おむつ」の間には因果関係はなさそうですが、スーパーとしては両者の売り場の動線を改善したり、仕入れ数を決めたりするのに十分役に立つ発見です。活用場面は企業活動だけとは限りません。過去に起きた犯罪やその関連データを分析し、次に犯罪が起こりそうなエリアを日々予測してそこを重点的にパトロールする、というシステムを警察が採用している例もあります。

相関関係があるという確度が高いならば、それが因果関係かどうか定かでなくても、予測には使えるということです。特にネット上の連動広告などの世界では、ある程度以上相関のありそうな要素を片っ端から試してみて、効果があるか検証し、より相関の強い候補を残していくという考え方が、既に広く浸透しています。

今回の番組の提言が批判的な眼で見られたことから考えると、こうした「相関を見て予測する」という発想が、世間一般にはまだ常識化していないのかもしれません。また、人間はとかく理由が気になる性質があり、理由が不明(因果関係が証明されていない)なのにあるかのような言い方をされると強く反発するものだ、とも考えられます。それに、因果関係が不明でも問題解決の打ち手として使えるのは、あくまでスーパーの売り場作りやパトロールのルート決め、バナー広告の選択のような、「ある程度失敗しても取り返しのつくもの」の範囲であって、社会制度の設計のような一度決めたら容易にはやり直しできないものには、もっと慎重さが求められるとも言えそうです。

コンピュータのビッグデータ処理で相関関係を見て、そこからものごとを予測するという考え方は、これからも急速に世の中に応用されて行くことでしょう。ただし、そもそもどんな問題をコンピュータに分析させるのか、またその分析結果からどこまで解釈を導くのか、こうした部分はまだまだ人間がしっかり関与していく必要がある。そんなことを考えさせられたケースでした。

<参考記事>
相関分析とは?【特選!グロービス学び放題】

 

名言

PAGE
TOP