【第10回】マイナスからはじめる生物統計学

「割合の比較(3)」 Fisherの正確検定


1.期待度数が5を下回ると…?
 連載第9回で説明させて頂いたχ2検定は、割合の差について比較を行う方法でした。もちろん、どのような統計ソフトウェアでも実施可能な、おそらくt検定に次ぐ有名な方法ですが、データ次第では以下のような警告が出てくることがあります。

「セルの 25% において、期待度数が 5 より小さくなっています。カイ 2 乗検定は妥当な検定でないと思われます。


 ご参考まで、上記は統計ソフトウェアのSAS(Statistical Analysis System)の実行後に出てくるWarningと呼ばれる警告です(SASでなくとも、SPSSでも似たような警告は出てきます)。看護系の学会や修士論文の発表会などで、一部の指導教官や少し統計をかじった人々により、発表者に対する攻撃や指弾の材料として用いられることも多い項目 1)ですが、実際のところはそれほど理解されていないのが現状です。これは、Cochran’s ruleと呼ばれるもので、1954年の論文 2)に記載されております。正確には「χ2検定の適用基準として、期待度数が5未満のセル(ひとつひとつの窓のこと。例えば2×2表であれば4つのセルがある)が全体の20%以上になってはいけない」なのですが、何となく「5未満」という言葉だけが先走っていて、「全体の20%以上」という部分が語られることはまずありません。上記の警告は、2×2表のうちのひとつが5未満であったために発せられた警告です。頻繁に用いられる2×2表においては、1つでも5未満のセルがあれば即25%になります。
 なぜχ2検定が不適切なのかといえば、χ2検定が近似によるものだからです。例えばt検定は、求めたT検定統計量の大きさから、t分布や正規分布を参照してその確率を求める方法ですが、χ2検定も同様、χ2検定統計量の大きさからχ2分布を参照して確率を求めます。その際ですが、期待度数が5を下まわるセルがある場合には、χ2分布への当てはまりが悪くなるため、結果として第1種の過誤(αエラー:本当は母集団同士に差が無いものを、検定の結果「有意差アリ」としてしまう過誤)の確率が大きくなってしまう可能性が高くなります。そこで、「Yatesの補正」 3)等も考案され、何とか小サンプルの事例にも対応してきた歴史があります。

2.Fisherの正確検定(Fisher’s Exact test)
 そこで、上記の理由によりχ2検定を用いてはならないということで、この方法を用いましょうとされるのが、「Fisherの正確検定」です。こちらの手法は1922年、R.A Fisher 4)により提唱されており、上記のCochran’s rule(1954)よりも以前のお話でした、ならばχ2とか言わなくとも、最初からFisherの正確検定でよいのは…と言いたい方もいらっしゃるかと存じますが、実は様々な事情がそれを許しませんでした。

 

 

執筆者について

経歴 ※このプロフィールは掲載記事執筆時点での内容となります

連載記事

コメント

コメント

投稿者名必須

投稿者名を入力してください

コメント必須

コメントを入力してください

セミナー

eラーニング

書籍

CM Plusサービス一覧

※CM Plusホームページにリンクされます

関連サイト

※関連サイトにリンクされます