【第5回】マイナスからはじめる生物統計学
統計的検定の仕組み(2) ~正規分布と検定?~
1. 正規分布は「普通(通常?)の分布」
正規分布を英語で言いますと、正規はregularで分布はdistributionだからと言って、regular distributionにはなりません。正解はNormal distribution、直訳すれば「普通(通常)の分布」になるわけですが、何が普通なのでしょうか?一節には、自然界の多くの物事が正規分布に従うなどと申しますが、少し日常の話題で考えてみましょう。そもそも「普通」という用語ですが、どこにでもあるようなありふれた存在であり、他と比較して特徴がない状態というのがOxford Languageの見解です。ありふれた存在ということは、それだけ多数存在するということになります。ありふれたというのはあまり良い表現ではないかもしれませんが、とにかく正規分布はありふれた分布であるということになります。その、ありふれた分布の形は一言で、平均値を真ん中にした左右対称の分布です。難しい公式などは覚えなくても、標準偏差が大きいほど横に広くなると覚えて下さい。
つまり、このような山の形をした平均値を中心に左右対称の分布こそが普通であり、最もありふれた分布であるということなのです。テストをやれば平均点付近の人が一番大勢になる、年収もきっと平均値あたりの人が一番大勢いる、身長も平均ぐらいの人、体重も平均ぐらいの人が一番多い、平均値あたりの割合が一番多く、そこから離れるほど人数が少なくなるであろう分布こそが普通の分布であり、正規分布なのです。逆に言えば、普通の物事は平均値あたりの人数が一番多くなるだろうということでもあります。
正規分布において平均値を0、標準偏差を1とした正規分布を「標準正規分布」と呼びます。平均値(真ん中)から±1の中に全体の68.3%が、±2の中には95.4%が含まれますという理論上の分布になります。例えば図3は成人男性の身長の理論分布になります。仮に全体が1,000人、平均値が170cm、標準偏差が10cmとなる場合、160cm~180cmの間に683人(68.3%)、150cm~190cmの間であれば954人(95.4%)の人が含まれます。150cm未満および190cm以上の人は1000-954=46人ですが、190cm以上の人は左右対称なので、46÷2=23人になります。
コメント
/
/
/
コメント