主要評価項目が複数ある場合はどうする？例を用いてわかりやすく解説

2022年4月20日

この記事では「主要評価項目が複数ある場合はどうする？例を用いてわかりやすく解説」ということでお伝えしていきます。

通常は主要評価項目は1つであることが多いですが、たまに複数の場合の論文を見ることがありますよね。

そのため、

主要評価項目（プライマリーエンドポイント）とはそもそも何？
主要評価項目が複数ある場合はどうすればいい？
主要評価項目が複数ある場合の試験目的達成条件は？

といったことをわかりやすく解説していきますね！

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

主要評価項目（プライマリーエンドポイント）とは？

そもそも主要評価項目とはなんでしょうか？

ICH E9（臨床試験のための統計的原則）には、以下のように書かれてあります。

ICH E9での主要評価項目

試験の主要な目的に直結した臨床的に最も適切で説得力のある証拠を与えうる変数

”証拠を与えうる変数”である必要があるため、その試験の目的を達成したかどうかを客観的に評価が可能な項目。

つまり、研究の目的に合致して、かつ、客観的に数値として評価可能な項目である必要がありますね。

PMDAの指針（新医薬品の臨床評価に関する一般指針について）では、以下のように書かれてあります。

PMDAの指針による主要評価項目

プライマリー・エンドポイントとしては一般に、臨床的ないし生物学的に意義があり、客観的測定、観察及び評価が可能で、薬理学的にも説明ができる曖昧でないものとする必要がある。

PMDAの指針の方がかなり具体的でイメージしやすい印象ですね。

主要評価項目の例

主要評価項目とは何かをなんとなく掴めたところで、ちょっとだけ例を見てみます。

糖尿病領域の新薬開発であれば、「HbA1cの変化率」が主要評価項目として使われていることが多いです。

HbA1cの変化率は客観的測定して評価することが可能ですよね。

また、抗がん剤の新薬開発であれば、「Overall Survival（OS）の期間」であったり「再発までの期間」が使われていたりします。

これらも、客観的測定して評価することが可能。

主要評価項目は何に基づいて決定される？

では主要評価項目は何に基づいて決められるのでしょうか？

それは「先行研究」や「臨床的・薬理学的に意味のあるもの」などの総合で決められるべきです。

そのため、主要評価項目の決定に関しては統計学的に基づくよりも、臨床的に基づくことが重要になります。

主要評価項目が複数ある場合は？

そんな主要評価項目は通常、1つの研究に対して1つ選ばれていることが多いです。

ICH E9でも「主要変数は通常ただ一つにすべきである。」と明記されています。

しかしながら、研究の目的によっては主要評価項目が必ずしも1つではなく、複数の場合があります。

複数といっても、10個も20個も主要評価項目があることはなく、普通は2つです。

主要評価項目が2つある場合、Co-primary end pointsと呼ばれています。

主要評価項目が2つの場合（Co-primary end points）の例

例えば、こちらの試験では主要評価項目は2つ設定されています。

Once-Weekly Semaglutide in Adults with Overweight or Obesity (John P.H. Wilding et al., March 18, 2021, N Engl J Med 2021; 384:989-1002)

本文中にこのように記載があります。

「The coprimary end points were the percentage change in body weight from baseline to week 68 and achievement of a reduction in body weight of 5% or more from baseline to week 68.」

つまり、「68週の体重の変化率」と「68週の体重がベースラインに比べて5%以上減少したか否か」の2つです。

「68週の体重の変化率」は連続量（量的データ）であり、「68週の体重がベースラインに比べて5%以上減少したか否か」は2値のカテゴリカル変数（質的データ）ですね。

なぜ主要評価項目を2つにしているのか？という疑問に対しては、厳密に言えば研究者しか説明できません。

「先行研究」「薬理学的に意味のあるもの」「薬を発売する上で重要な指標」などを含めて、総合的に判断されるべきことです。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

主要評価項目が複数ある場合の試験目的達成条件は？

主要評価項目が複数ある場合、ある問題が出てきます。

それは多重性の問題。

主要評価項目が2つあるということは、少なくとも2つの統計学的な検定を実施するということだからです。

では、上記の論文ではどのように多重性の問題に対処しているかというと、閉手順を用いていることで対処していました。

閉手順とは、検定に順番をつけること。

1つ目の検定で有意だったら2つ目の検定に進み、2番目の検定が有意なら3番目の検定に進みます。

もし検定結果に有意差がなかったら、それ以降の検定は実施しないことで、多重性の問題に対処するのです。

上記の論文では多重性の問題を閉手順で対処していましたが、閉手順にも注意点があります。

それは、「2つとも」達成しなければ研究目的が達成されないという条件になってしまうこと。

つまり、通常の研究よりも、より厳しい基準で試験目的を達成したかどうかを判断することにつながります。

なので、αエラーよりもβエラー（検出力）を考えるべきかもしれないですし、ここは研究目的次第で適切な判断をすることが求められます。

統計の専門家と協議すべき点ですね。

まとめ

いかがでしたか？

この記事では「主要評価項目が複数ある場合はどうする？例を用いてわかりやすく解説」ということでお伝えしました。

主要評価項目（プライマリーエンドポイント）とはそもそも何？
主要評価項目が複数ある場合はどうすればいい？
主要評価項目が複数ある場合の試験目的達成条件は？

といったことが伝われば幸いです！

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

主要評価項目が複数ある場合はどうする？例を用いてわかりやすく解説