前提の間違い 平均アベレージの間違い
正規分布といってとたんにみんなイヤな気持ちになっているはずだ。「日本人は正規分布になっていると信じているのは間違いだ」という話なのだが。
100点満点のテストがあった時に平均点がだいたい50点くらいになっていて、0点と100点に向けてだんだん人数が減っていくという風になるのが正規分布だ。
グラフにすると富士山みたいになる。
現実はこうはならない。これを日本語で書くと「平均的な日本人は一番多い日本人ではない」ということになる。
私自身何かに評価をつけるときに、そこが5段階で1から5までの評価になっているときになんとなく3か4にしている。私がこうしているのは3か4が一番多いはずだと信じているからだ。
でも今書いたように基本正規分布にはならない。
今の話でいうと「私は実際3か4が一番多いはずだと信じているから評価をなんとなく3か4にしている」がこういう風になることを正規分布というのだ。でも実際は5が一番多いこともあるし1が一番多いこともあるのだ。これが正規分布にならないということだ。
実際表計算ソフトでつまるひとがいる。平均値を求めるのは「アベレージ」だが最大値を求めるのは「マックス」だ。アベレージとマックスは一緒になるはずだと信じているひとが多いのだ。こういうことを書くとイライラしているひとが多いことはわかっている。申し訳ない。
これを日本語でいうとさっきの文章になる。
「平均的な日本人は一番多い日本人だ」というのならアベレージとマックスは一緒になる。でも実際はそうはならないのだ。だから「平均的な日本人は一番多い日本人でではない」。
でも私も含めて日本人は「平均的な日本人は一番多い日本人だ」と信じている。これが間違いなのだ。