優越性・非劣性・同等性試験の違いは？なぜマージンを使うのか？

2022年7月6日2024年10月29日

この記事では「優越性・非劣性・同等性試験の違いは？なぜマージンを使うのか？」ということでお伝えします。

優越性試験・非劣性試験・同等性試験の、3種類の試験の名前だけは聞いたことがあるという方もいると思います。

しかし、その違いを明確に説明できるか？と言われたら自信がない。。

そんな状況であれば、ぜひこちらの記事を参考にしてみてくださいね！

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

優越性・非劣性・同等性試験はどう違う？

まずは優越性試験・非劣性試験・同等性試験の違いを見ていきましょう。

優越性試験：比較相手に勝つことを示したい試験
非劣性試験：比較相手に劣っていないことを示したい試験
同等性試験：比較相手と同じであることを示したい試験

共通しているのは「比較相手がいる」ということ。

例えばプラセボだったり、実薬だったり、先発品だったりという、比較相手がいる前提。

その上で「比較相手に対して今回の新規治療がどういった結果になってほしいか」の違いが、この3種類の試験の違いです。

3つの試験の成功イメージを95%信頼区間で示すとこうですね。

一番上の赤い線が優越性達成を示しています。

つまり、優越性試験は95%信頼区間が「差=0のライン（帰無仮説のライン）」を超えていれば成功、ということです。

真ん中の赤い線が非劣性達成を示しています。

つまり、非劣性試験は95%信頼区間が「非劣性マージン」を超えていれば成功、ということ。

一番下の赤い線が同等性達成を示しています。

つまり、同等性試験は95%信頼区間が「両側の同等性マージン」の間にあれば成功、ということです。

詳しくは後で説明しますね！

統計的検定では優越性しか示せず非劣性と同等性は示せない

優越性試験は、なんとなく馴染みがあるかなと思います。

問題なのは非劣性試験と同等性試験。

非劣性試験と同等性試験で特有なのが「マージン」という考え方ですね。

上記の図で見たように、非劣性試験と同等性試験はマージンと95%信頼区間の位置関係で成功かどうかが決まる試験。

そうなると、一つ疑問が出てきます。

それは「統計学的検定で有意差ありの場合には優越性が示せるのなら、有意差なしの時に「同じ」と言っていいのでは？」ということ。

しかしこれはNGなんです。

統計学的検定で「差がある」は示せても、「同じ」や「劣っていない」は示せないんです。

P値では、差があることは証明できても同等であることを証明することはできない。

これは重要な知識ですので、ぜひ理解しておきましょう。

じゃあ有意差がない場合はどんな結論になるの？と思ったかもしれません。

有意差がない場合は「今回のデータで有意差を見出せなかった」という結論しか導けないので、注意してくださいね。

同等性マージンや非劣性マージンはどう設定するの？

同等性試験や非劣性試験で最も頭を使わなければならないのが、マージンの設定です。

同等性マージンや非劣性マージンを適切に設定できれば、解析自体は95%信頼区間を出力するだけですから。

じゃあ、「同等性マージンや非劣性マージンはどう設定するの？」と思いますよね。

実はそこが一番難しい。

「こうすれば自動的にマージンが決まりますよ」というマニュアル的なものがあれば簡単なのですが、実際には各試験ごとに考えて設定する必要があります。

では「何を考えてマージンを設定するのか？」ということですが、ヒントはICH E9のQ&Aに記載があります。

そちらを抜粋させていただくと、以下の通り。

同等限界は、疾患の領域や薬剤の性質、評価変数が計数値か計量値かなどを考慮し、臨床的な検地から、それぞれ設定すべきであり、領域ごとに専門的な合意が得られていることが望ましい。そうでない場合には、申請者が個々の臨床試験において臨床的に適切と考えられる値を設定することになるが、承認申請においては、設定した同等限界の妥当性の根拠を明示し、説明できることが重要である。実薬対照の非劣性試験を行う場合には、少なくともプラセボとの差が明確となる範囲を設定する必要がある。（引用：https://www.pmda.go.jp/files/000156112.pdf）

つまり重要なことは

第三者の専門家との合意があるといい
マージンの妥当性の根拠を明示して説明できること

ということです。

第三者の専門家との合意を形成するのも、妥当性の根拠を説明できないといけないため、結局は「マージンの妥当性の根拠を明示して説明できる」ということが非常に重要になりますね。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

優越性試験はどのような場合に使う？適切な解析手法は？

では、3種類の試験についてそれぞれ詳しく見ていきましょう。

まずは優越性試験。

優越性試験は「比較相手より優れている」ということを示したい場合に使う試験です。

例えばどんな時か？といえば、プラセボ対照の比較試験なんかがすぐに頭に浮かびます。

多くの研究や試験では優越性試験を想定しているはず。

優越性試験での適切な解析手法

そして優越性試験では統計学的検定を用いてOK。

統計学的検定は「差がある」ことを証明することが可能だからです。

共分散分析、ロジスティック回帰分析、Cox比例ハザードモデルなどの回帰分析も、もちろんOKです。

非劣性試験はどのような場合に使う？適切な解析手法は？

では次に非劣性試験。

非劣性試験は「比較相手より劣っていない」ことを示したい試験でした。

どんな時に使うかといえば、例えば実薬対照の比較試験。

有効性は比較する実対照薬とほぼ同じ程度でも、別なメリットがある場合に使える試験です。

例えば、新しい治療法の方が侵襲性が低いというメリットがあるので、有効性は同じでも良い。

IV投与の薬があるが経口投与の薬を開発したい、など新しい治療法の方が簡便な投与ができるので、有効性は同じでも良い。

などですね。

そして、「劣っていない」ことさえ示せればいいため、結果的に優れていても問題ないという点。

しかし逆に言えば、非劣性を目的として試験を実施し、結果的に優れたとしても結論は「非劣性が示された」ということだけ。

決して「優れていることが示された」にはならないので、注意してください。

非劣性試験での適切な解析手法

非劣性試験での解析手法は、非劣性マージンと95%信頼区間の位置関係把握で解析する、ということ。

前述の通り、統計学的検定では非劣性を示すことができません。

じゃあどうすればいいのか？といえば、まずは非劣性マージンを定義する必要があります。

非劣性マージンの決め方はとても重要で、非劣性マージンがどこになるかが超重要になる試験です。

非劣性マージンとは「実対照薬よりも劣る幅として臨床的に許容される最大のレベル」ということで知られています。

しかし「こう決めたらOK」という決め方がなく、研究者が決めて当局と合意を取ることが重要。

ただし、非劣性マージンの決め方の「考え方」はあります。

そして非劣性マージンが決まったら、95%信頼区間との位置関係を把握します。

95%信頼区間が非劣性マージンを超えていれば非劣性を達成で、非劣性マージンを跨いでしまったら非劣性は達成せず、という結論になります。

「非劣性マージンを超えていれば非劣性達成」という条件のみなので、有意に負けているのに非劣性が達成する場合もあるんです。

例えば以下の例の下の赤い線は、差＝0の線より劣っているが、非劣性マージンを超えている状況。

この場合でも非劣性は達成してしまいます。

しかし、当然「本当に非劣性達成でいいの？」という議論が出るので、当局とのやりとりは発生することが予想されますね。

↓無料で学会発表や論文投稿に必要な統計を学ぶ

↑無料で書籍を配布中♪

同等性試験はどのような場合に使う？適切な解析手法は？

では最後に同等性試験について。

同等性試験は「比較相手と同じである」ことを示したい試験です。

例えば、後発薬の開発なんかでは頻繁に使われる試験です。

特徴としては、比較相手より優れていても劣っていてもダメ、ということ。

例えば後発薬の開発を考えてみても、「先発品より効果が高い」というのは逆に怖いです。

同等性試験での適切な解析手法

同等性試験は、同等性マージンと95%信頼区間の位置関係把握で解析します。

そのため、まずは同等性マージンを定義する必要があります。

非劣性マージンと同様、「こう決めたらOK」という決め方がなく、研究者が決めます。

しかし後発薬の同等性試験であれば、ガイドライン（後発医薬品の生物学的同等性試験ガイドライン）があるためそれに準じる必要があります。

そのガイドラインでは「生物学的同等の許容域は、AUC 及びCmaxが対数正規分布する場合には、試験製剤と標準製剤のパラメータの母平均の比で表すとき 0.80～1.25 である」と記載がありますので、それにしたがってマージンを設定します。

そして同等性マージンが決まったら、95%信頼区間との位置関係を把握します。

95%信頼区間（もしくは90%信頼区間）が同等性マージンの間に入っていれば同等性達成。

同等性マージンを跨いでしまったら同等性は達成せず、という結論になります。

まとめ

いかがでしたか？

この記事では「優越性・非劣性・同等性試験の違いは？なぜマージンを使うのか？」ということでお伝えしました。

3種類の試験の特徴を把握し、目的に応じて使い分けていただければと思います。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

優越性・非劣性・同等性試験の違いは？なぜマージンを使うのか？

優越性・非劣性・同等性試験はどう違う？