【第7回】マイナスからはじめる生物統計学

症例数(n数)と信頼区間

1.理系あるある?
 10年ほど前ですが、理系あるある(2014,小谷太郎,幻冬舎新書)という本が話題になりました。理系の人の行動パターンや発言について、まさしくタイトルの通り「あるある!」と頷かせてくれる内容で、私も一気読み(?)してしまいました。著者の小谷先生は理学の博士号をお持ちで、もちろんバリバリの理系のご出身なわけですが、間違いなく文系*の方にも楽しめる内容です。その中で、テレビなどでアンケートの話題が出てくると「n数はいくつだ!」と思わずツッコミを入れてしまう様子などは、まさしく私にとっても「あるある」で、きっと読者の皆様にとっても「あるある」ではないでしょうか?そのココロは、nが少ないアンケートは「信頼性が無い」と言いたいわけですが、確かにアンケートの中には割合のみを示すだけで、n数については語られないような悪質(?)なものもあります(その周辺の話題は連載第2回をご参照願います)。
 もちろん、医学研究においてn数を語らない、割合だけの記載などは一切認められません。比較の場合には検定の結果(p値など)も求められますが、もちろんp値さえあれば良いものでもありません。医学研究において求められるのは95%信頼区間です。

2.95%信頼区間
 連載第4回の最後に、t検定の平均値の例題の数値が不自然に細かい点を記載しました。例えばA群B群の両方において母集団の平均体重が70kg、標準偏差が20kgの場合は、仮にサンプル数(n数)が10零の場合ですと、95%信頼区間は以下のように計算されます。ここではあらかじめ母集団の平均値と標準偏差が分かっている(既知)場面設定になっておりますが、基本的に医学研究では母集団のバラツキが不明な場合が圧倒的に多いので、あえて母集団が分かっていない(未知)の場合の式で計算します。仮に両方とも分かっている場合は、下記式の2.26をおなじみの1.96に書き換えて下さい。

 10症例で求められたA群の成人男性の体重の95%信頼区間は、母集団の平均体重が70kg、標準偏差が20kgの場合、

左側の下限値を計算すると55.7kg、右側の上限値を計算すると84.3kgになります。しかし10名程度では平均値プラスマイナス14.3kgにもなりますので、推定と呼ぶには少々心許ない気がしますね。同様にB群の母集団の平均体重が70kg、標準偏差が20であった場合、サンプル上はA群の平均値が55.7kg、B群の平均値が84.3kgになることも考えられます。残念ながらサンプル数10名ではこれが限界であり、これ以上のことは言えません。両自治体とも、仮に母集団(=成人男性全員)の平均体重が同じ70kgだったとしても、仮にそれぞれが下限値、上限値を取ってしまった(滅多にありませんが)場合などは、母集団同士は全く同じなのに、サンプル上は差があるように見えてしまうような現象も発生しかねません。この場合は、両自治体間で最大28.6kgもの差となりますので、t検定統計量は3.20、p値は0.005(<0.05)となり、「有意差あり」と判断されてしまいます。試しに100症例ならば下限値66.0kg~上限値74.0kgと平均値±4kgまで推定の幅が小さくなりました。仮に1000症例であれば、下限値68.8kg~上限値71.2kgと、さらに信頼区間が狭くなります。
 早い話が、サンプル数が大きくなるほど95%信頼区間の幅は狭くなります。

 

 

執筆者について

経歴 ※このプロフィールは掲載記事執筆時点での内容となります

連載記事

コメント

コメント

投稿者名必須

投稿者名を入力してください

コメント必須

コメントを入力してください

セミナー

eラーニング

書籍

CM Plusサービス一覧

※CM Plusホームページにリンクされます

関連サイト

※関連サイトにリンクされます