どうもうまくいっていない? -ギャンブラーの誤謬 

  • このエントリーをはてなブックマークに追加
  • このエントリーをはてなブックマークに追加

問題です

以下のAさんの問題は何か。

Aさんはプロ野球選手。新しいバッティングフォームの改良に取り組み、以前よりもはるかに高い打率を残せそうなフォームを編み出した。

「これなら、おそらく、3回に1回はヒットを打てる、つまり3割3分3厘くらいの打率を残せそうだ。うまくいけば、首位打者だって・・・」

ところが、開幕以来、最初の試合は4打数の1安打、そして次の試合、さらにその次の試合も同様であった。自分自身の感覚は悪くないのに、なかなか結果が出ない。現在のところ、成績は、合計すると12打数3安打、打率2割5分であった。

「うーん。なかなかうまくいかないな。ひょっとして、自信がかえってあだとなって、力をうまく引き出せていないんだろうか。何がおかしいんだろう?」

19348310ff28d8badc458f5d6efc5781 e1422005048972

解答です

今回の落とし穴は、「ギャンブラーの誤謬」です。これは確率論の大数の法則を理解せず、非常に少ないサンプル数から誤った結論を出してしまうというものです。他に「ギャンブラーの誤謬」が該当するシーンとしては、コイン投げやルーレットの赤黒において、同じ結果が何回か続くと、確率論的にはたとえば2分の1であったとしても、「次も表(あるいは裏)が来るはず」と思い込んでしまうというケースがあります。

まずは、統計学の有名な法則である大数の法則について理解しましょう。これは、ある一定の確率(ここではこれを「真の確率」と呼びましょう)で生じる事象は、試行回数を十分に大きな数(通常、数千回以上)まで増やすと、どんどん本来の「真の確率」に近づいていくというものです。

たとえば、正確に作られたサイコロは、数千回も振れば、どの目も出る確率は6分の1に近づくはずです。同様に、ちゃんと作られたトランプならば、1枚引いては戻し、ということを繰り返せば、どのマークが出る確率も、試行を重ねるにつれ4分の1に近づいていくでしょう。これが大数の法則です。

大数の法則をビジネスに用いている業界に保険業界があります。1人、2人しか顧客がいなければ、(死亡保険だとして)その顧客がいつ亡くなるかは分かりません。しかし、顧客が数万人規模でいれば、たとえば男性なら、現在50歳の人であれば、平均80数歳までは生きるだろうという前提で(ちなみに、この数字は、平均寿命より大きな数字になります。その理由は皆さん考えてみてください)、大数の法則をベースに保険料などを設定し、確実に儲けを残すことが可能になるのです。

それでは冒頭のケースは何がまずかったのでしょうか(野球のバッティングは、サイコロやトランプのようにそもそも「真の打率」に相当するようなものがない、あるいは、毎回の試行が独立ではなく、それまでの試行に影響される、などの要素もありますが、ここではそれらはいったん捨象して考えます)。

結論から言うと、たかだか12打数という非常に少ない試行回数で、本来上げられるであろう打率3割3分3厘が無理なのではないかと判断したところに、典型的なギャンブラーの誤謬が見て取れます。仮に「真の打率」が3割3分3厘だとしても、12打数で3.6安打未満(つまり3割以下。このケースでは、実質的には3安打以下)の成績となってしまう確率は、計算すると40%弱もあります。逆に、打率が3割から4割の間に入る確率は、12打数4安打のパターンのみで、これはおよそ24%です。つまり、12打数程度の試行回数では、「真の打率」が3割3分3厘であっても、3割以下という数字しか残せない可能性は非常に高いのです。

これが100打数になると、「真の打率」が3割3分3厘の選手が、3割未満の打率となる確率は、21%程度に下がります。逆に、3割台の打率を残している可能性は70%近くに上がります。500打数となると、これらはそれぞれ、5%、95%となります。明確に、試行数が増えると、本来の実力に数字が接近してくるのが分かります。

よく、市場調査などで、「サンプル数はできれば300以上とることが望ましい」と言われるのも、理屈は同じです。サンプル数が小さければ小さいほど、真の平均値から遠ざかってしまう可能性が高くなるからです。統計数字などでは必ずサンプル数をチェックし、どのくらいのブレが構造的に生じうる調査なのかを意識しておきたいものです。

ところで、これは余談ですが、かつてイチロー選手がマリナーズで3割7分2厘の自己最高打率を残した時、「次は4割」という期待が高まりました。しかし、イチロー選手という選手の個性を考えると、4割達成はやはり容易ではありません。なぜなら、1番バッターで打数が多いため、大数の法則が働いて、「真の打率」に収束しやすいからです。もしある年の「真の打率」が3割6分だとすると、700打数で4割を超える確率は、わずか1.5%です。ところが、もし450打数でいいのなら、それが4.4%と約3倍になります。

プロスポーツでは、最初の1、2カ月はものすごい成績を残す選手がたいてい現れるものですが、長丁場のシーズンを終わってみると、結局は実力者が上位を占めるものです。スポーツ観戦の楽しみの1つは記録ですが、こんな観点も持って選手の数字を眺めてみるのも一興です。

最後にもう1つ余談。相撲の千秋楽では、7勝7敗の力士の勝率が極めて高く、海外の経済学者にまで、確率論の常識を超えているということが古くから指摘されてきました。なぜこのようなことがおこるのか、ぜひそのメカニズムも考えてみてください。

名言

PAGE
TOP