新刊『
テクノベートMBAキーワード70』の1章「データ/AIの基本」から、「Keyword002 行動データ」を紹介します。
テクノベート化が進む昨今、データというものに対する見方もずいぶん変わってきました。かつては人間の自然な思考パターンに合う、属性データや意識に関する調査データが重宝されました。しかし昨今は、そうしたデータはいったん脇に置いていい、行動データさえ捕捉できれば、十分に効果的な形で価値提供できるという発想に変わりつつあります。アマゾンのリコメンデーションなどがその典型です。検索した言葉や過去に買ったモノのデータが正確に取れれば、本人の意識などは分からなくても、十分に効果的なリコメンデーションはできるということです。今後も、ますます行動データの重要性が高まっていくことが予想されています。
(このシリーズは、グロービスの書籍から、
PHP研究所了承のもと、選抜した項目を抜粋・転載するワンポイント学びコーナーです)
行動データとは?
移動、購買、グーグル検索など、ある人が実際に行った行動を反映した数値データのこと。オンライン上の行動(サイト訪問、閲覧時間など)とオフラインでの行動(現金利用率など)に分けて扱うことも多い。
解説
これまでは、一般にデータを扱う際には、性別、年齢、住所などの「属性データ」や、アンケ一卜やヒアリングなどで収集される「意識に関するデータ」といったものを使っていました。
しかしこれらのデータは、往々にしてあてにならないことが多くありました。特に、意識に関するデータは、その人の実際の意識や行動を正確には反映していない、ということも多かったのです。
属性データの信頼度は、そのデータのソースに大きく左右されます。たとえば日本においては、運転免許証やパスポート、住民票に記載された生年月日や国籍、(生物学的な)性別はほぼ100%信頼できるでしょう。
しかしこれが履歴書の情報となると、少し怪しくなってきます。人によっては学歴を詐称することがあるかもしれませんし職歴も多少ごまかす人はいるでしょう。病院で書く問診票の既往歴情報なども必ずしも正確とは限りません。将来的にはこれらもデータベース化される可能性はありますが、2019年時点では、ある程度のコストをかけないと、属性データを100%信頼することはできないと言えます。
アンケ一卜やヒアリングなどで収集される「意識に関するデータ」は、その信頼度により疑問符がつきます。たとえば、「1週間で、どのくらいスマホを利用しますか?」という質問をされた時、多くの人間はその場で記憶を頼りに質問に答えようとします。しかし人間は物事を忘れやすく、記憶はさまざまな要素によって影響を受けてしまいます。よって、ここで正確なデータを得られることはまずありません。
また、アンケートやヒアリングに答える際には、見栄や忖度などのバイアスが入るという点も見逃せません。たとえば「1日に何分くらいニュースを見たり読んだりしますか?」と対面で大人に質問した場合、「全く見ない」「5分」などと答えるのは恥ずかしいので、「20分」「30分」といったように多めに答えてしまうことが多いのです。
あるいは、会社が招いた社外の経営者などの講話を聞いた後のアンケートで感想を求められた時、実際には5点満点の3点くらいだと思っていても、関係者に忖度して5点と書いてしまう人も多いでしょう。
行動データは「ウソをつかない」データ
それに対して行動データは、測定さえできればウソをつかないデータです。たとえばウェブページでの滞留時間や購入金額などはごまかしようがありません(もっとも現時点では、スマホやパソコンの向こう側にいる人物が、本人か否かを確認するのは必ずしも容易ではありませんが)。
顧客満足度なども、アンケートで高い点数をつけたとしても、その後に「リピート購入」や「購入金額のアップ」といった行動につながっていなかったら、実はそれほど満足していなかったのでは、と考えることができます。
ただ、行動データは回数や時間などは比較的容易に測定できるものの、その行動の「質」までは測定しきれないという問題もあります。たとえば消費者の歩いた動線データが正確に計測できたとしても、実際に商品を見比べているのか、ただぼんやりと歩いているのかといった判断はつきにくい、ということです。
また、ウェブ上の行動データは正確とされていますが、あるサイトに長くとどまっていた理由が、たまたまそのサイトを見ている時に別の用事ができてしまい、そのページを開きっぱなしにしてしまった、という可能性も考えられます。
こういった行動の質をどのように正確に補捉していくかは、今後の課題と言えそうです。たとえば、複数のセンサーを駆使することで、この問題はクリアできると考える専門家もおり、現在研究が進んでいるところです。
(本項担当執筆者:嶋田毅 グロービス出版局長)