新薬開発や後発医薬品(ジェネリック医薬品)の開発において、薬剤の有効性と安全性を科学的に評価することは極めて重要である。その中でも、すでに承認されている医薬品(先発医薬品)と新しい医薬品が、体内で同等に作用するかを評価する生物学的同等性試験は、非常に重要な役割を担っている。この試験では、一般的な統計学的有意性検定で用いられる95%信頼区間ではなく、90%信頼区間が使用される。なぜ90%信頼区間が採用されるのか、その理由と、統計学的有意性との違いについて詳しく解説する。
生物学的同等性試験の概要
生物学的同等性試験は、主に後発医薬品が先発医薬品と「生物学的に同等である」ことを証明するために行われる臨床試験である。具体的には、同じ有効成分を含有する2つの薬剤(試験薬と対照薬)を健康な被験者に投与し、血中濃度推移を測定する。そして、血中濃度曲線下面積(AUC)や最高血中濃度(Cmax)といった薬物動態パラメータを比較し、両薬剤の吸収速度と吸収量が同等であることを統計学的に評価する。これにより、効果と安全性が先発医薬品と同等であると判断され、後発医薬品の承認へと繋がる。
90%信頼区間が用いられる理由
生物学的同等性試験で90%信頼区間が用いられる主な理由は、双方向性の同等性(two-sided equivalence)を評価するためである。通常の統計学的有意性検定では、「差があるかないか」「効果があるかどうか」という仮説(例:薬Aは薬Bよりも効果がある)を評価するために両側検定 あるいは 両側 2.5 %ずつ棄却域を設けた、95%信頼区間が用いられる。しかし、生物学的同等性試験では、試験薬が対照薬より優れていても劣っていてもいけなく、両者が「十分に同等である」ことを示す必要がある。
この「十分に同等である」ことを統計的に評価するために、設定された同等性許容域(通常、平均値の比が0.80~1.25の範囲)の中に、薬物動態パラメータの幾何平均値の比の90%信頼区間全体が収まっているかどうかを確認する。これは、実質的に以下の2つの片側検定を同時に行っていることに相当する。
- 試験薬の薬物動態パラメータが、対照薬よりも過度に大きくないこと(上限を超えないこと)
- 試験薬の薬物動態パラメータが、対照薬よりも過度に小さくないこと(下限を下回らないこと)
それぞれの片側検定で5%の有意水準を設定すると、両側で合計10%のリスク(つまり、誤って同等と判断してしまうリスク)を許容することになる。つまり、これが 90%信頼区間ということである。もし95%信頼区間を用いてしまうと、両側の信頼区間がそれぞれ2.5%ずつの有意水準で計算され、同等性を示すための基準が厳しすぎると考えられる。
統計学的有意性試験の際の95%信頼区間との対比
特徴 | 生物学的同等性試験 | 統計学的有意性試験 |
目的 | 両薬剤が同等であることを示す | 試験群と対照群に差があることを示す |
信頼区間の設定 | 90%信頼区間 | 95%信頼区間 |
検定の方向性 | 双方向性の同等性(試験薬が対照薬より優れても劣ってもいけない) | 両側検定(差の有無) |
帰無仮説 | 2つの薬剤が同等ではない(差がある) | 2つの薬剤に差がない |
対立仮説 | 2つの薬剤が同等である | 2つの薬剤に差がある |
統計学的有意性試験では、主に新しい治療法が既存の治療法やプラセボよりも効果があるか、あるいはある介入が特定の効果をもたらすかを検証する。ここでは、「効果がない」という帰無仮説を棄却し、「効果がある」という対立仮説を採択することが目的である。この際、第1種の過誤(誤って効果があると判断してしまうリスク)を5%以下に抑えるために、一般的に95%信頼区間が用いられる。
一方、生物学的同等性試験では、帰無仮説は「2つの薬剤は同等ではない(差がある)」であり、対立仮説は「2つの薬剤は同等である」となる。つまり、通常の有意性検定とは仮説の立て方が逆転している。90%信頼区間が同等性許容域内に収まることで、帰無仮説が棄却され、両薬剤が生物学的に同等であると結論づけられる。
まとめ
生物学的同等性試験において90%信頼区間が採用されるのは、一方的に優位性を証明する通常の統計学的有意性検定とは異なり、薬効の「等価性」を保証し、試験薬と対照薬が過不足なく「同等である」ことを、統計学的に厳密かつ合理的に評価するためである。
コメント