臨床試験(治験)では、必ず統計解析担当者が試験を実施するメンバーに入ります。
治験は、大きく分けて3つ。
それぞれ3つの試験ごとに、試験の目的も変わりますし、統計解析担当者が考えていることも変わります。
ですが、共通して考えていることは、バイアスの回避です。
バイアスの回避のために必ず行うことが、SAP(解析計画書)の作成ですね。
この記事では、なぜ臨床試験(治験)で統計が必要なのか、そしてSAPが必要なのか。
3種類ある臨床試験それぞれで統計解析担当者が何を考えているのか。
さらにはバイアスの回避ということを考えてみます。
SAP(統計解析計画書)は臨床試験(治験)で必要?
医薬品開発で統計が果たす5つの役割をまとめてみます。
治験での統計の役割1: 結果を要約するということ
個別データを十分に吟味することも重要ですが、最終的に個別データを報告することはできません。
何らかの形でデータの要約を実施しないことには、たくさんのノイズからシグナルを発見することが困難です。
そのため、平均値や分散などがデータを要約するのに用いられます。
治験での統計の役割2: 結果を判断する材料の提供
データを要約するだけでもある程度の結果を判断することが出来ます。
ですが、ヒストグラム、箱ひげ図、散布図などのグラフを作成することでも様々な情報が得られます。
さらに、検定や95%信頼区間を計算することが、論文などで結果を記述するために必要になります。
治験での統計の役割3:結果の一般化と言い過ぎの防止
試験から、何かしらの傾向があったとします。
しかしながら、この傾向はたまたまの偶然によって生じたものかもしれません。
そのため、得られた結果が偶然の範囲内なのか、それとも偶然を超えた意味ある変動かを判断する必要があります。
治験での統計の役割4:客観化、標準化
臨床試験に関して、研究者の主観に依存して、結果の評価や結論が異なるのは困ります。
そのため、何らかの形で客観的な評価を行う必要があります。
統計は、計算さえ間違わなければ、誰でも同じ結果が得られます。
治験での統計の役割5:科学的で効率的な実験の構成
統計学は、データが出た後で使うものだと考えている人が多いかもしれませんが、これは認識の誤りです。
本当は、データを取る前のほうが重要な役割を果たします。
試験のデザインをどのように組むことが効率的で、何例の患者さんが試験に入ればよいかを決定するうえで、統計学的な考慮は重要になります。
このように、臨床試験において統計学は非常に重要な役割を果たします。
治験で統計が一番必要な場面
統計学の役割として一番大きいのは、結果の一般化と言い過ぎの防止だと思っています。
私も仕事柄、さまさまな試験を担当し、様々なデータを取り扱ってきました。
その中には、主要な解析で結果が良くないものもしばしば含まれます。
そんな時、周りの方が絶対言うのが「効いているところを探してくれ」ということです。
統計学的には、上記のようなことはナンセンスです。
たくさんある検査項目の中で、やみくもにデータをいじくりまわしてあるところに効きそうな結果が出ても、それは偶然の要素が大きいということです。
これは、結果だけでなくその薬剤の特徴や試験に入った患者さんの特性などを考慮して慎重に扱うべきです。
まるで宝を探し当てたかのように大騒ぎになることがありますが、何のことはない、偶然です。
それを理論的に制するのが臨床試験の統計担当者にとって、一番苦労する仕事かもしれません。
臨床試験の第I相試験での統計学の役割
第I相試験でも統計解析担当者がメンバーに入りますが、実はデザイン段階では統計解析担当者が担う部分は少ないです。
というのも、第I相試験は人での薬物濃度や安全性をざっくりと確認する試験だからです。
非臨床(動物実験)での薬物動態(PK)データ薬力学(PD)データを踏まえ、用量を決めることが試験を始める段階で一番重要です。
そのため第I相試験では、統計担当者ではなく薬理担当者の出番が多くりますね。
症例数に関しても、通常は1アームに対して、プラセボ群2例と実薬群6例のダブルブラインド試験にすることが多いです。(抗がん剤以外の薬剤の場合です。抗がん剤の試験ではこの限りではありません。)
この症例数は統計学的仮説に基づくものではなく「薬物動態と安全性を探索的に検討するのに必要な例数」という決まり文句で決定されます。
そのため第I相試験では、症例数に関して検討することは比較的少ないです。
第I相試験の症例数はいつも、プラセボ群2例、実薬群6例か?
製薬企業としては、承認申請に耐えうるデータを取りつつも、試験を早く安価に実施したい、という思いがあります。
これは営利企業では当たり前の姿勢ですし、安価に開発することができれば、その分発売した時の価格を低くできるので、社会にとっても有意義です。
実は、薬の開発で一番お金がかかるのが、臨床試験に入る症例数の人数です。
本当に、何千万円単位で費用がかかります。。
そのため、治験の費用を抑えるために一番手っ取り早いのが、症例数を少なくすることです。
以上の理由から、私も過去には「プラセボ群2例、実薬群6例」よりも少なく出来ないか?という相談を受けた経験が何度もあります。
しかし、第I相試験の症例数は、統計学的な計算に基づいた症例数でないため、統計的な観点からアドバイスできることは限られています。
ですが、第I相試験では薬物動態と安全性が検討出来ればよいため、もし薬物動態のバラツキが個体間で小さいような場合には、もう少し症例数を少なくするという選択肢も可能かもしれません。
このような疑問があった場合には、統計解析担当者や薬理担当者に相談してみることが良いです。
第I相試験での統計担当者の重要ポイント:ブラインド項目があるかどうかだけは確認しよう
ブラインド項目という言葉を知っていますか?
通常は1アームに対して、プラセボ群2例と実薬群6例のダブルブラインド試験にすることが多いと書きました。
では、Key情報(薬剤群の情報)をブラインドにするだけ十分でしょうか?
実は、もうちょっと検討しなければなりません。
というのも、薬剤の作用機序上、通常の検査でその人がどの薬剤群かどうかがばれてしまうことがあります。
例えば、糖尿病薬として2014年に販売された、SGLT2阻害剤という薬を考えてみましょう。
この薬剤の作用機序としては、腎臓での糖の再吸収を阻害し、尿と一緒に排出するすることで、血中の糖を下げてしまうという薬です。
そのため、尿中の糖の検査をリアルタイムで実施すると、必ず誰が実薬群であるかが分かってしまうのです。
このように、直接の薬剤情報ではなくても、何かしら検査を行った場合にその人がどっちの群かどうかがわかってしまう項目があります。
これは、ブラインド試験であった場合に、試験が終わるまで試験の実施者には開示しない方が良いですよね。
これをブラインド項目、と呼びます。
なぜブラインド項目が重要かというと、ブラインド項目の情報を知った時に薬剤群の情報が知られてしまい、試験結果にバイアスが入る恐れがあるからです。
だから、ブラインド項目がないかを事前に確認する必要があります。
試験実施後の統計解析担当者の役割
試験実施後には、とにかく集計です。
集計とは、要約統計量を算出するということです。
要約統計量として何を出力するかはまた悩ましいところですが、N、平均、SD、中央値、最小値、最大値、が出ていれば第I相試験としては問題ありません。
あらゆる検査項目に対して、上記の項目を出力するような集計を実施します。
また、第I相試験での症例数ぐらいであれば、データの一覧表を眺めることも重要になります。
100人や1000人の試験を一覧表で確認することは難しい(というか不可能)ですが、1群6例であれば、気になるデータを一つ一つ確認することも重要です。
そのために、散布図や個別推移図(スパゲティプロット)を作成して確認することも有意義です。
CSR作成では、統計担当者は結果を言いすぎていないか?をチェック
臨床試験を実施後は、必ず試験報告書(CSR;Clinical Study Report)を作成しなければいけません。
その際に確認することは大きく2つです。
- 集計が適切に反映されているか
- 結論が飛躍していないか
「1群6例の試験で決定的なことは何も言えない」というスタンスを常に持ち、結果に対する言い過ぎがないかを確認していくことが重要になります。
臨床試験の第II相試験での統計学の役割:SAP(統計解析計画書)作成が必要
第II相試験からは、統計解析担当者の役割が大きくなります。
その理由は、第I相試験よりも試験デザインがより複雑になるためです。
試験のデザインが複雑になるということは、試験デザインに対して考えることができる自由度が高くなります。
そのため、科学的妥当、かつ、効率的に実施するにはどうすればよいか?ということも考えていく必要があります。
第II相試験を計画する段階で統計解析担当者が考えていること
第II相試験の計画段階で統計解析担当者が考えていることは、大きく分けて5つぐらいあります。
- 症例数の設計
- 検定の多重性の有無
- 層別因子の有無
- 中間解析の必要性
- データの取り方
まず、試験の前に症例数を設計する必要があります。
第II相試験は検証的試験ではないため、αエラーやβエラーを厳密にコントロールする必要はありませんが、症例数は統計学的な仮説に基づいて設計することをお勧めします。
そして、第II相試験は用量反応性を確認することが多いため、群が多くなります。
その際に、統計的検定をそのまま実施すると、多重性の問題が生じてきます。
そのため、多重性をコントロールするにはどういう方法を取らなければならないかを決めておく必要があります。
次に、層別因子を検討します。
層別因子とは、主要評価項目に影響を及ぼすと考えられる、背景情報のことです。
この主要評価項目に影響を及ぼすと考えられる背景情報が群間で偏っていた場合には、結果が薬剤によってもたらされたものなのか、それとも背景情報の違いによってもたらされたものなのか、の区別がつかなくなるためです。
これを交絡バイアスと呼びます。
そして、中間解析を実施する必要性があるかかどうかも検討します。
現在は、臨床試験を効率的に実施するために様々な試験デザインが提案されてきています。
その最たるものが、中間解析を利用した試験です。
中間解析にはその性質によって、様々な用途として使うことが出来ます。
試験を早期に終了させたり、症例数をあとで追加する、といったことを検討することができます。
ただし、この中間解析に関しても、実施にはバイアスが入ってくるリスクが発生するため、実施にはリスクとベネフィットを天秤にかける必要があります。
そして、とても重要なのが、データをどう取るか?ということを考えることです。
試験の計画が決まれば、どのような結論に持っていきたいかということまで考えることが出来ます。
そして、その結論に持っていくにはどのようなデータを取る必要があるか?を考えることが出来るということです。
これが考えれれれば、あとはデータを取得するためのフォーム(CRF;Case Report Form)を設計していくことが可能になります。
CRFの設計は、ダイレクトにデータ解析の効率に関係していきますので、ぜひとも統計解析担当者と議論しながら作成したいところです。
第II相試験中の統計解析担当者の役割
第II相試験も、何か倫理的な問題がない限りダブルブラインド試験にすることが多いです。
また、統計学的な仮説に基づいた症例数ということは、試験後には統計的検定を実施することになります。
そのため、ブラインド下でデータを確認し、主要評価項目に対する解析は計画した通りで本当に大丈夫か?第I相試験では確認できなかった、主要評価項目に影響を及ぼすさらなる背景情報はないか?などを検討します。
これをブラインドレビューと呼びます。
そして、全てのデータが準備完了する前までに、解析計画書(SAP)を作成する必要があります。
解析計画書はブラインドレビューの結果を踏まえてデータの固定前、もしくは開鍵前前までに最終化する必要があります。
第II相試験後の統計解析担当者の役割
試験後には、解析計画書に準じて解析を実施することが重要です。
そして、解析計画書で計画した解析が一通り出そろったところで、この試験の結果を解釈するのに追加すべき解析はないか?を考えます。
解析計画書をデータの固定前、もしくは開鍵前前までに最終化するということは、そのあとに追加解析を実施してはいけないのではないか?という疑問もあるかもしれませんが、追加解析は許されています。
ただ、その結果の取り扱いには注意が必要です。
例えば、追加解析として検定をすることは許されません。
主要な結果はあくまでも事前に計画された結果しか主張することが出来ません。
その結果をサポートするための解析という位置づけであれば、追加解析が許されるということです。
臨床試験の第III相試験での統計解析担当者の役割:SAP(統計解析計画書)の作成が超重要
第III相試験の目的は、その薬剤が本当に有効性と安全性を両立している薬剤か、を検証することです。
有効性の検証には、統計学的検定が用いられます。
この検定の結果、P値が0.05未満であれば有効性が検証されたことになり、薬剤としては成立することになります。
もしP値が0.05を上回るようであれば、今までの努力が水の泡になってしまいます。
そのため、第III相試験前までに実施した試験のありとあらゆるデータを吟味したうえで、第III相試験を計画する必要があります。
そして、そのようなデータの解釈に強いのが統計解析担当者ですので、第III相試験ではその役割が重要になってきます。
第III相試験計画時の統計解析担当者の役割
試験計画時は、実は第II相試験とやることはあまり変わりません。
今までのデータを十分吟味して、計画するということです。
一つだけ違う点では、今度は承認申請を見据えた計画をする必要があるということです。
承認申請をするには、第III相試験で主要評価項目が検証されることが必要ですが、その他にも、その薬剤の安全性のための症例数が十分か?ということも重要になってきます。
例えば、慢性疾患(糖尿病や高血圧など)の領域では、1年間の実薬群の安全性データを100例以上集めなさい、という決まりがあります。
また、承認された後の売り上げを考えた際に、追加しておきたい評価項目がないか、そしてその項目はどのようにデータを示す必要があるのか、といったことを考える必要があるのです。
第III相試験中の統計解析担当者の役割
これも第II相試験とやることはそれほど変わりません。
ただ、検証的な性質があるため、ブラインドレビューの重要性がより一層増すということは言うまでもありません。
ブラインドレビューでは色々なことを考える必要があります。
主要評価項目に影響を与える背景情報を探索することもそうですが、主要評価項目のバラツキは事前に考えていたものより大きくないか、欠測データをどう扱うか、解析対象集団をどうするか、そういったことも考える必要があるのです。
そしてデータ固定の前までには、統計解析計画書(SAP)を作成する必要があります。
第III相試験後の統計解析担当者の役割
これも、第II相試験と同じです。事前に定めた解析計画書に基づいて、解析を実施します。
そしてP値が0.05を見事に下回った場合には今度は申請が待っていますので、今までの試験データを統合した解析を実施する必要も出てきます。
この承認申請のための解析計画も事前時用意することが望ましいです。
というのも、競合が多い薬剤開発の中では、承認申請をいかに迅速に実施できるか、ということがカギになるからです。
SAPは臨床試験(治験)でいつでも必要?まとめ
統計解析担当者の役割は、試験の相によって異なってきます。
一般的には、I相<II相<III相の順に、その役割の大きさが大きくなっていきます。
特に第III相試験での統計の役割は、試験計画時から試験終了後まで多岐に渡ります。
いずれの試験にせよ、解析方法は統計解析担当者の協力なくして実施することは不可能です。
というのも、どの試験であっても重要なことは「バイアスを回避すること」です。
バイアスに関して一番精通しているのが統計解析担当者ですので、必ず試験前には相談しましょう。
そのためにも、より密な関係を気付いて、いつでも相談し合える関係になっておくことが重要です。
コメント
コメント一覧 (2件)
[…] >>>臨床試験(治験)で統計解析が必要な理由は?バイアス回避に重要 […]
[…] より厳密に計画を立てるなら、解析計画書(SAP)にどちらのカイ二乗検定結果を使うか明記するのがベストですね!! […]