この記事では「主要評価項目が複数ある場合はどうする?例を用いてわかりやすく解説」ということでお伝えしていきます。
通常は主要評価項目は1つであることが多いですが、たまに複数の場合の論文を見ることがありますよね。
そのため、
- 主要評価項目(プライマリーエンドポイント)とはそもそも何?
- 主要評価項目が複数ある場合はどうすればいい?
- 主要評価項目が複数ある場合の試験目的達成条件は?
といったことをわかりやすく解説していきますね!
主要評価項目(プライマリーエンドポイント)とは?
そもそも主要評価項目とはなんでしょうか?
ICH E9(臨床試験のための統計的原則)には、以下のように書かれてあります。
”証拠を与えうる変数”である必要があるため、その試験の目的を達成したかどうかを客観的に評価が可能な項目。
つまり、研究の目的に合致して、かつ、客観的に数値として評価可能な項目である必要がありますね。
PMDAの指針(新医薬品の臨床評価に関する一般指針について)では、以下のように書かれてあります。
PMDAの指針の方がかなり具体的でイメージしやすい印象ですね。
主要評価項目の例
主要評価項目とは何かをなんとなく掴めたところで、ちょっとだけ例を見てみます。
糖尿病領域の新薬開発であれば、「HbA1cの変化率」が主要評価項目として使われていることが多いです。
HbA1cの変化率は客観的測定して評価することが可能ですよね。
また、抗がん剤の新薬開発であれば、「Overall Survival(OS)の期間」であったり「再発までの期間」が使われていたりします。
これらも、客観的測定して評価することが可能。
主要評価項目は何に基づいて決定される?
では主要評価項目は何に基づいて決められるのでしょうか?
それは「先行研究」や「臨床的・薬理学的に意味のあるもの」などの総合で決められるべきです。
そのため、主要評価項目の決定に関しては統計学的に基づくよりも、臨床的に基づくことが重要になります。
主要評価項目が複数ある場合は?
そんな主要評価項目は通常、1つの研究に対して1つ選ばれていることが多いです。
ICH E9でも「主要変数は通常ただ一つにすべきである。」と明記されています。
しかしながら、研究の目的によっては主要評価項目が必ずしも1つではなく、複数の場合があります。
複数といっても、10個も20個も主要評価項目があることはなく、普通は2つです。
主要評価項目が2つある場合、Co-primary end pointsと呼ばれています。
主要評価項目が2つの場合(Co-primary end points)の例
例えば、こちらの試験では主要評価項目は2つ設定されています。
Once-Weekly Semaglutide in Adults with Overweight or Obesity (John P.H. Wilding et al., March 18, 2021, N Engl J Med 2021; 384:989-1002)
本文中にこのように記載があります。
「The coprimary end points were the percentage change in body weight from baseline to week 68 and achievement of a reduction in body weight of 5% or more from baseline to week 68.」
つまり、「68週の体重の変化率」と「68週の体重がベースラインに比べて5%以上減少したか否か」の2つです。
「68週の体重の変化率」は連続量(量的データ)であり、「68週の体重がベースラインに比べて5%以上減少したか否か」は2値のカテゴリカル変数(質的データ)ですね。
なぜ主要評価項目を2つにしているのか?という疑問に対しては、厳密に言えば研究者しか説明できません。
「先行研究」「薬理学的に意味のあるもの」「薬を発売する上で重要な指標」などを含めて、総合的に判断されるべきことです。
主要評価項目が複数ある場合の試験目的達成条件は?
主要評価項目が複数ある場合、ある問題が出てきます。
それは多重性の問題。
主要評価項目が2つあるということは、少なくとも2つの統計学的な検定を実施するということだからです。
では、上記の論文ではどのように多重性の問題に対処しているかというと、閉手順を用いていることで対処していました。
閉手順とは、検定に順番をつけること。
1つ目の検定で有意だったら2つ目の検定に進み、2番目の検定が有意なら3番目の検定に進みます。
もし検定結果に有意差がなかったら、それ以降の検定は実施しないことで、多重性の問題に対処するのです。
上記の論文では多重性の問題を閉手順で対処していましたが、閉手順にも注意点があります。
それは、「2つとも」達成しなければ研究目的が達成されないという条件になってしまうこと。
つまり、通常の研究よりも、より厳しい基準で試験目的を達成したかどうかを判断することにつながります。
なので、αエラーよりもβエラー(検出力)を考えるべきかもしれないですし、ここは研究目的次第で適切な判断をすることが求められます。
統計の専門家と協議すべき点ですね。
まとめ
いかがでしたか?
この記事では「主要評価項目が複数ある場合はどうする?例を用いてわかりやすく解説」ということでお伝えしました。
- 主要評価項目(プライマリーエンドポイント)とはそもそも何?
- 主要評価項目が複数ある場合はどうすればいい?
- 主要評価項目が複数ある場合の試験目的達成条件は?
といったことが伝われば幸いです!
コメント