QCの役割を徹底理解【第5回】

サンプリングはロット全体の一部からサンプルを取り、それを試験することで全体を推定するために行います。選挙前のアンケートによる選挙結果の予測と同じです。
サンプリングにおいては、計量値と計数値があります。含量や不純物量のように連続した結果が得られるのは計量値と呼び、アンプルの不溶性異物など1本/個と数を数えられるものは計数値と呼び、それぞれの統計/確率の基礎が異なっています。
統計の一週間セミナーを参加され、F/t検定や分散分析を習っていても、肝心の統計的な考え方を学んでないことが多いのです。そのために現場において統計的な考えができていません。統計/確率は検定の時に使うものと思われているようです。医薬品製造において、難しい統計の考えは不要です。バラツキの概念とOC曲線(Operating Characteristic Curve)の概念を身に付けるだけで充分です。統計/確率を数式で考えると数学の知識も必要になり難しいですが、感覚を統計/確率で裏づけることができるだけで充分です。
1. バラツキを知る
1) 標準偏差
平均値(=中央値)からバラツキの大きさを表す指標です。ここで知っておきたいことはどのようにして求めるかの式を理解しておく必要があります。
分散;
標準偏差;√σ2
この式で覚えておきたいことは、個々の値から平均値を引いた値を二乗してその合計をデータ数nで割り、その平方根(√)を取った値が標準偏差だということです。
よって、一つでも飛び離れた値があると標準偏差が大きくなります。個々のデータを見ずに標準偏差を求めている場合、異常値が含まれていると間違った標準偏差の値を活用してしまうことになります。データを眺めるとは飛び離れたデータがあるのかどうか、全体のデータのヒストグラムがどうなっているかを知った上で、標準偏差の値を活用します。
PVや安定性試験で3ロットの3に拘る理由
PVは原則3ロット、洗浄バリデーションも原則3ロットと、GMPでは3ロットが基本になっています。なぜ3ロットに拘るのでしょうか?
データ数
1個 98% ⇒ 98% 1個だけで他はわからない。
2個 98%,104% ⇒ データ数が2個あると平均値(101%)がでる。
3個 98%,104%,98%
データ数が3個あると平均値(100%)以外に標準偏差(2.8%)がでます。すなわち、データ数が3個以上だと統計量としての標準偏差が求まるので、バラツキがわかるのです。ではデータ数が増えると何かメリットがあるのでしょうか?
データ数が1個の場合とデータ数が増えた場合の真の値は、データ数が多い方が真の値に近づきます。ではデータ数との関係はどうなのでしょうか? σ/√nの関係があります。nの平方根で割りますで、それだけバラツキが減ることになります。n=1に比べ、n=3だと√3=1.732なので、σ=2の時は、1.15まで小さくなります。
2ページ中 1ページ目
コメント
/
/
/
この記事へのコメントはありません。
コメント