人間はアンケートなどにおいて往々にして嘘をつくことが知られています。対人インタビューや記名アンケートの場合は特にその傾向は強いのですが、無記名のアンケートでも人は嘘をつくものです。たとえば、名作と言われる文学作品リストを挙げられ、「読んだことのあるものにチェックしてください」という質問をすると、無記名アンケートであっても、「教養がない」と思われたくないため、読んでいない作品にもチェックを入れたりするのです。もちろん正確に答える人もいますが、トータルで見ると過剰申告になるのが普通です。
このような「嘘」とどう付き合うかということが昔からアンケートやインタビューの課題でした。そこに「検索ワード」という観点から新しい視点を提供したのが本書です。著者のセス・スティーヴンズ=ダヴィドウィッツ氏は元グーグルのデータサイエンティストです。彼は、パソコンやスマートフォンに打ち込む検索ワードはそうした嘘をつかず、人間のその時々の思いや本音を正直に反映していることに気がついたのです。
本書はまた、人間の嘘を見抜くだけではなく、人々が打ちこんだ検索ワードというビッグデータからどのような有用な情報が得られるか、さまざまな応用の可能性を豊富な事例とあわせて紹介しています。
ちなみに、人々がフェイスブックのようなSNSに上げている情報はまさに嘘の塊です。著者の分析によると、アメリカの既婚女性は、夫についてSNSへの投稿では「最高」「親友」「驚異的」「誰よりすごい」「超かわいい」などと表現する一方で、グーグル検索では「ゲイ」「嫌なやつ」「驚異的」「うんざり」「いやらしい」といった検索語が上位を占めていると指摘しています。いかに人が見栄をはって嘘をつくかを示す分かりやすい例と言えるでしょう。
検索ワードのビッグデータはまた別の効用ももたらします。たとえば、ある指標と相関関係や因果関係の強い(通常、人間には気がつきにくい)代理変数の発見です。本書では数多くの事例が紹介されていますが、ここでは3つ挙げましょう。
1. 経済政策や株価に大きな影響を与える失業率は、取りまとめに時間がかかるため、公式機関から発表されるまでにかなりのタイムラグがあります。リアルタイムの失業率と相関関係の高い検索ワードはないものでしょうか?そうした問題意識から著者が調べたところ、「職業斡旋所」や「次の仕事」といった検索ワード以上に相関が高かったのは、アメリカで有名なポルノサイトや流行りのゲームの名前だったといいます。つまり、人は(特に男性は)失業して暇になるとポルノサイトを見たりゲームをして暇つぶしをするのです。この情報は、株式投資などをしている人間には非常に有用な情報となる可能性があります。
2. 大統領選挙では、検索の際に候補2人の名前を同時に入れる人がかなりの比率に上ります。そこで重要なのは入力の順番でした。分析の結果、「トランプ クリントン」と入れた人の多い州では、「クリントン トランプ」の順で入れた人が多い州に比べて、非常に相関関係高くトランプに票が入ったそうです。それは人々が本音を語るとは限らない、専門機関の調査以上の精度だったそうです。
3. これは著者とは異なる研究グループの調査結果ですが、すい臓がんの患者は、特徴的な検索ワードを入れることがわかりました。当初「腰痛」を調べ、後に「肌の黄ばみ」と検索することはすい臓がんの予兆と考えられるのです。同様に「消化不良」と調べてから「腹痛」を検索する人もすい臓がんの比率が高かったそうです。研究者たちは、すい臓がんらしいパターンで検索する人の5%から 15% は、ほぼ確実にがんであると指摘しました。これは(治すのが難しい病気ではありますが)早期治療などの役に立つ可能性が高そうです。
さて、ビッグデータという言葉が浸透してしばらく経ちますが、著者は本書を通してそのメリットとして大きく4つのことを指摘しています。
1)新種のデータが手に入る:本書ではいわゆる「下ネタ」系の検索ワードや差別語とされる検索ワードが頻出します。これらはこれまで公の場やアカデミックではほぼ無視されて来たデータですが、先述の①の例にも示したように、使い方によっては役に立つ示唆を得ることも可能なのです
2)正直なデータが手に入る:これはすでに述べてきたことですが、検索ワードは自分を偽ることの少ない「本音発見器」の役割を果たしえます
3)元のデータ数が巨大なのでセグメント化が容易:仮にサンプル数が1000しかなかったら、それをさらにセグメント化すると、一気にサンプル数が減って有意な情報を得にくくなります。たとえば、1000人の女性のデータがあったとしても、「東京都港区在住で子どもが3人いて、国産車を保有している」と条件を増やすと、一気に該当者は減ってしまいます。しかしビッグデータは元々超巨大なデータですから、細かくセグメント化しても情報量が多く、有用な知見を得ることができるのです
4)比較対照しやすいので因果関係の検証も容易:近年、A/Bテストなどの方法論が進化してきましたが、こうしたテストを積み重ねていくと、単に効果の高い施策を打てるだけではなく、ある程度まで因果関係に迫ることも可能になります。単に相関関係があるというだけではなく、因果まである程度説明できれば、人々の納得感はさらに高まります
ビッグデータやIoT、IoB(Internet of Bodies)、AIなどと賢く付き合っていくことはこれからのビジネスパーソンにとって当然の素養になるでしょう。そうした時代を生きていく我々にとって、多くのヒントをもたらしてくれている本書はぜひ読んでおきたい1冊です。
『誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性』
セス・スティーヴンズ=ダヴィドウィッツ著
1,944円