偽陽性とは?
偽陽性とは、実際では陽性ではないのに、陽性であると判断することを指します。今回はこの「偽陽性」から、ビジネスでもよく起こりうる統計のミスについて解説します。
統計の世界ではよく、2種類のミスを犯すことを戒めます。ひとつは、この「実際には非AなのにAと判断するミス(第一種過誤、もしくは偽陽性、アルファ過誤ともいう)」、そしてもう1つは「実際にAであるのに非Aと判断するミス(第二種過誤、もしくは偽陰性、ベータ過誤ともいう)」です。例えば、どのような状況でこのミスが起こるのでしょうか?
「偽陽性」で起こる判断ミスの例
以下のA氏の考え方の問題点は何でしょうか。
A氏は、ある感染症のウイルスに感染しているのではないかと思い、検査を受けてみることにしました。この感染症は、一度ウイルスに感染すれば、時期の差こそあれ、ほぼ間違いなく発病します。しかも、治癒の方法はなく、あとは緩やかな死を迎えるだけという、大変恐ろしいものです。今の日本では、5万人に1人がウイルスのキャリア(ウイルスを体内に持続的に所持していながら、症状を呈さない健康な状態にあるヒト)と予測されています。
検査の現在の精度は99.9%。つまり、99.9%の精度でキャリアかそうでないかを見分けることが可能という非常に高精度のものです。そして、後日、A氏にもたらされた結果は「陽性」でした。
「これで俺の人生もお終いだ。この病気にかかったら、もはや逃れる術はない」
注)上記の感染症および検査方法は架空のものです
精度99.9%の検査で陽性が出たのですから、A氏でなくとも天を仰ぎたくなるでしょう。しかし、ここで自暴自棄になってしまうのは早計です。もう少し冷静に考えてみましょう。A氏は本当に99.9%このウイルスのキャリアなのでしょうか?実際には非キャリアであるのに、キャリアと判断されてしまった可能性もあるわけです。
陽性か偽陽性か、確率を計算してみよう
A氏がこのウイルスに関して陽性と判断される場合を考えると、以下の2つがあることがわかります。
- 実際にウイルスキャリアで、正しい検査結果として陽性となった
- 実際にはウイルスキャリアではないのに、検査結果が間違っていて陽性となった
<1>と<2>の確率を計算してみましょう。まず、<1>ですが、現在、我が国でのウイルスキャリアは5万人に1人という前提ですから、A氏が実際にウイルスキャリアである確率は、(1/50000)×0.999=0999/50000となります。一方、<2>については、(49999/50000)×0.001=49.999/50000となります。
つまり、<2>の可能性の方が、<1>に比べ、およそ50倍高いわけです。1対50(2%弱)という数字は現実的にはかなり恐怖感のある数字と言えるでしょうが、99.9%に比べれば、かなり安心感は高まるのではないでしょうか(もっとも、2%くらいの方がかえって心理的に嫌だ、という人はいるかもしれませんが)。
ただし、同じ検査をして2回続けて「陽性」となると、実際に陽性である可能性はかなり高まります。ここでは計算結果は示しませんので、ぜひ皆さん考えてみてください。
数字を活用し、精度を上げた冷静な判断を
一般に、世の中のほとんどの人は数学を不得手としています。今回のような、中学生レベルの数学で説明できるような内容でも、とっさに気が回る人は多くはありません(ちなみに、やや専門的になりますが、「ベイズの定理(ベイズ確率)」では、偽陽性と偽陰性の割合は、その検査の精度のみでは決まらず、サンプルの陽性あるいは陰性比率によって大きく変わってくることを証明しています)。
特にビジネスの世界に「絶対」はありません。あるビジネスプランを見て、一人の権威が「絶対に成功しない」と言ったからといって、それだけで一喜一憂する必要はないのです。その権威だって間違っている可能性はあるわけですから。一喜一憂するのは、もっと多く人々の意見を聞いて、精度を上げてからで遅くないのです。そうした冷静な判断をする意識は持ちたいものです。