【第10回】マイナスからはじめる生物統計学

2024/06/21 その他

大橋 渉

前回に引き続き割合の検定のお話です。

「割合の比較(3)」 Fisherの正確検定


1.期待度数が5を下回ると…?
 連載第9回で説明させて頂いたχ2検定は、割合の差について比較を行う方法でした。もちろん、どのような統計ソフトウェアでも実施可能な、おそらくt検定に次ぐ有名な方法ですが、データ次第では以下のような警告が出てくることがあります。

「セルの 25% において、期待度数が 5 より小さくなっています。カイ 2 乗検定は妥当な検定でないと思われます。


 ご参考まで、上記は統計ソフトウェアのSAS(Statistical Analysis System)の実行後に出てくるWarningと呼ばれる警告です(SASでなくとも、SPSSでも似たような警告は出てきます)。看護系の学会や修士論文の発表会などで、一部の指導教官や少し統計をかじった人々により、発表者に対する攻撃や指弾の材料として用いられることも多い項目 1)ですが、実際のところはそれほど理解されていないのが現状です。これは、Cochran’s ruleと呼ばれるもので、1954年の論文 2)に記載されております。正確には「χ2検定の適用基準として、期待度数が5未満のセル(ひとつひとつの窓のこと。例えば2×2表であれば4つのセルがある)が全体の20%以上になってはいけない」なのですが、何となく「5未満」という言葉だけが先走っていて、「全体の20%以上」という部分が語られることはまずありません。上記の警告は、2×2表のうちのひとつが5未満であったために発せられた警告です。頻繁に用いられる2×2表においては、1つでも5未満のセルがあれば即25%になります。
 なぜχ2検定が不適切なのかといえば、χ2検定が近似によるものだからです。例えばt検定は、求めたT検定統計量の大きさから、t分布や正規分布を参照してその確率を求める方法ですが、χ2検定も同様、χ2検定統計量の大きさからχ2分布を参照して確率を求めます。その際ですが、期待度数が5を下まわるセルがある場合には、χ2分布への当てはまりが悪くなるため、結果として第1種の過誤(αエラー:本当は母集団同士に差が無いものを、検定の結果「有意差アリ」としてしまう過誤)の確率が大きくなってしまう可能性が高くなります。そこで、「Yatesの補正」 3)等も考案され、何とか小サンプルの事例にも対応してきた歴史があります。

2.Fisherの正確検定(Fisher’s Exact test)
 そこで、上記の理由によりχ2検定を用いてはならないということで、この方法を用いましょうとされるのが、「Fisherの正確検定」です。こちらの手法は1922年、R.A Fisher 4)により提唱されており、上記のCochran’s rule(1954)よりも以前のお話でした、ならばχ2とか言わなくとも、最初からFisherの正確検定でよいのは…と言いたい方もいらっしゃるかと存じますが、実は様々な事情がそれを許しませんでした。

 

 

2ページ中 1ページ目

執筆者について

大橋 渉

経歴

愛知医科大学 臨床研究支援センター 准教授 博士(医学)

東京学芸大学大学院教育学研究科、東京医科歯科大学情報医科学センター特任助教、財団法人臨床研究情報センター、製薬企業等において臨床研究の支援及び医薬品の開発、製造販売後調査等に従事。富士通株式会社においてマーケティングデータ解析案件などに従事の後、2018年より現職。専門とする医学、生物、保健統計学の他、教育学、社会学、心理統計なども経験。

※このプロフィールは掲載記事執筆時点での内容となります

12件中 1-3件目

コメント

コメント

投稿者名必須

投稿者名を入力してください

コメント必須

コメントを入力してください

セミナー

eラーニング

書籍

CM Plusサービス一覧

※CM Plusホームページにリンクされます

関連サイト

※関連サイトにリンクされます