その勝敗予想、正しいですか?「平均値」の罠のバリエーションを知ろう

平均値は身近な数字ですが、そこには数多くの罠があることが指摘されています。よく言われるのは、典型的な正規分布(釣鐘状の分布)以外の分布では、平均値より中央値の方が実態をあら合わしていることが多く(年収や資産など)、平均値はかえってミスリーディングになるといったことなどです。今回は、それ以外の、よくありがちな平均値にまつわる錯覚や罠について2つ紹介しましょう。

スピードの平均に意味はある?

例えば、ロサンゼルス・エンジェルスの大谷翔平選手が3球速球を投げたとします。順に時速160km、153km、155kmであれば、「今日の大谷選手の速球は、だいたい(160+153+155)÷3=時速156kmだ」と言ってもそれほど問題はなさそうです。

では以下の例はいかがでしょうか。オリンピックでも採用されている水泳の200m個人メドレーで考えてみます。飛び込みやターンの影響などは考慮せず、また疲れなどもいったん無視できるものとしましょう。速い選手はどちらでしょうか?

A選手

バタフライ:秒速1.4m

背泳ぎ:秒速1.4m

平泳ぎ:秒速1.3m

自由形:秒速1.5m

B選手

バタフライ:秒速1.5m

背泳ぎ:秒速1.5m

平泳ぎ:秒速1.0m

自由形:秒速1.7m

先の大谷選手のケースと同様に考えると、A選手は(1.4+1.4+1.3+1.5)÷4=秒速1.4m、B選手は(1.5+1.5+1.0+1.7)÷4=秒速1.425mですから、B選手の方が先にゴールしそうに思えます。しかしこれが大錯覚なのです。

実際にゴールまでにかかる時間を計算してみましょう。200mのメドレーですから、各泳法について泳ぐ距離は50mです。A選手がゴールするまでの時間は、(50÷1.4)+(50÷1.4)+(50÷1.3)+(50÷1.5)≒140.5秒となります。それに対してB選手は(50÷1.5)+(50÷1.5)+(50÷1.0)+(50÷1.7)≒146.1となります。実は、5秒半ほどA選手の方が早くゴールに到着するのです。

ここでのポイントは、水泳の個人メドレーは、トータルとしての時間の合計を競う競技であるという点です。B選手は平泳ぎが苦手なせいで、この泳法だけでA選手に14秒ほど差をつけられ、他の泳法ではカバーできないのです。速度の平均ではなく、(距離÷速度)の合計(平均でも同様)で考えなくてはならないのに、最初の計算ではそれを錯覚で見落としてしまったわけです。

ドライブで同じ道を往復する場合、往路の時速が60km、復路の時速40kmの時の平均時速が50kmではなく、48kmになるのと同様の理屈です。数学用語でいえば調和平均です。速度のような「割り算」関係の数字は、しばしばその意味を錯覚しがちなので要注意です。

平均年齢の落とし穴

平均年齢は多くの人にとって身近でよく見る数字ですが、実はここにも落とし穴があります。さて何でしょうか?

それは、年齢という数字は「切り捨て」の数字であるにもかかわらず、それを忘れてしまいがちという点です。たとえば50歳の人に「何歳ですか?」と尋ねて、「50.9歳です」あるいは「50.0歳です」などという人はまずいません。50歳になったばかりの人も、50歳と364日の人も同じ50歳と答えるという点がポイントです。表現を変えると、「50歳」と答えた人の平均年齢は、実は50.5歳なのです。

厚生労働省の人口動態調査のような正式な調査では、この点を踏まえ、「切り捨ての年齢」の平均値に0.5歳を足すという調整を行っています。2019年の神奈川県の女性の初婚年齢はちょうど30.0歳だったようですが、この調整を除くと、結婚時の「切り捨ての年齢」の平均は29.5歳だったと推定されるわけです。

ただ、こうした調整をしっかり行っている調査は少数派ではないでしょうか。たとえばティーン向けの雑誌だと「ファーストキスは何歳の時?」などというアンケートが載ったりしますが、おそらく0.5歳を加えるという調整はしていないことが多いでしょう。10代のころの0.5歳の差はそれなりの差ですから、その数字を見て焦るティーンも多いのではないでしょうか(それ以上に、この手のアンケートでは、サンプリングに偏りがある、あるいは見栄から正確な数字を答えないという罠の影響が大きそうではありますが)。

平均年齢という身近な数字にも、実は罠が潜んでいるのです。

今回は2つのケースを紹介しましたが、皆さんは「平均値」と正しく付き合えているでしょうか? あらためて考えてみてください。

RELATED CONTENTS