臨床試験(治験)のデザインを考える

バイアス(偏り)とは?医薬・医療研究で統計的に気にすべき3種類

医薬・医療研究を実施する上で、統計的に必ず気にしなければならないことが2つあります。

 

  • バイアス(偏り)を避けること
  • 精度を確保すること

 

この2つを意識しないと、最悪の場合には、間違った結果を導いてしまうことになります。

そんな最悪の状況を避けるため、このページでは、まず「バイアスとは?」「精度とは?」ということを理解します。

その上で、なぜバイアスが厄介なのか、そして気にすべき3種類のバイアスについて考えていきます。

 

 

医薬・医療研究をを実施する上で統計的に重要なバイアスと精度

①バイアス(偏り)を避けること、②精度を確保すること。

この2つは医薬・医療研究を実施する上で統計的に考えるべき重要なことです。

 

ダーツの例を見ながら、この2つの違いを明らかにしましょう。

 

 

この中で、一番良い状況はどれでしょうか?

3本がどの位置にいると、私たちにとってとても良い状況なのでしょうか?

 

そう、私たちが目指すべきは、真ん中の図です。

ダーツの的の真ん中に矢が3本とも刺さっている状況です。

このとき、バイアス(偏り)は小さく、精度は高いといえます。

なぜこの状況がバイアスが小さく精度は高いかという説明はあとでしますので、今は「ふーん」ぐらいに思っておいてください。

 

では左の図。

これは3本とも同じような場所に刺さっていますが、右下に集まってしまっています

このときバイアス(偏り)は大きいが、精度は高いということができます。

 

最後に右の図ですが、3本がばらばらな場所に刺さっており、その3本が右側に集まってしまっています

このときバイアス(偏り)は大きいし、精度も低いといえます。

 

このダーツの例をそのまま統計の話に置き換えると、真ん中が得たい値(真の値)です。

そして、ダーツの矢が実際に得られた値です。

つまり、3本の矢の集まり具合が精度を表しており、矢がどれだけ真ん中から離れているかということがバイアス(偏り)を示しています。

これを観てわかる通り、私たちは医薬・医療研究の計画段階で、どれだけデータを真ん中に集中して集められるかということを意識する必要があります

 

 

バイアスとは?

ICH E9では、偏り(バイアス)を以下のように定義しています。

ちなみにICH E9とは「臨床試験のための統計的原則」について、という文書で、臨床試験に携わる方であれば、必ずや一度は目を通しておくべき文書です。

こちらにリンクを貼っておきますね。

 

https://www.pmda.go.jp/files/000156112.pdf

 

では話を戻して、ICH E9でのバイアスの記載です。

 

臨床試験の計画、実施、解析及び結果の解釈と関連した因子の影響により、試験治療の効果の推定値と真の値に系統的な差が生じること

 

なかなか難しい説明なので、平易な言葉に言い換えましょう。

 

何かが原因で、効く薬が効いていない(効かない薬が効いている)という試験結果になってしまうこと

 

ということです。

 

かなり嫌な状況ですよね。

本当は効く薬なのに、効いていないと結論づける「何か」。

その「何か」を我々は計画段階で出来るだけ排除しなければならないのです。

 

 

排除すべきバイアスは3種類ある

バイアスは大きく分けて3種類あります。

 

①選択バイアス

②情報バイアス

③交絡バイアス

 

これらを詳しく説明していきますね。

 

選択バイアス

選択バイアスとは、試験の対象となるtarget population(目的の母集団)とsample(標本)の間に偏りが生じてしまうことです。

 

例えば、赤ちゃんの子持ち世代のマーケティング調査を得たいとします。

この時に、サンプル(標本)となるデータを、大学に取りに行くとしたらどうでしょうか?

赤ちゃんがいる子持ち世代なんて、ほとんど大学にいませんよね。

それよりも、保育園の帰りの時間にデータを取りに行った方が、はるかに目的にあったデータになります。

 

このように、実際に知りたい集団(今回だと赤ちゃんの子持ち世代)とサンプル(標本)の選択のされ方が異なる場合、選択バイアスになります。

 

医薬研究を例にしてみましょう。

世の中には大学病院のような最先端の研究を担う病院もあれば、クリニックのような地方に密着した医療を提供する病院もあります。

もし臨床試験が大学病院だけで実施されれば、その結果はクリニックの患者でも再現されるかどうか分かりません。

高血圧の薬を開発している時に、大学病院に通う人だけで試験を実施したら、恐らくその集団は、高血圧以外にもかなり重症な合併症を引き起こしている、重症な患者さんを対象にするでしょう。

 

 

しかし新薬は大学病院に限らずクリニックの患者さんにも届けたいわけですから、Targetとなる集団と、試験に組み入れられる集団にはズレが出てしまっています。

このようなバイアスのことを選択バイアスと呼びます。

 

そして、選択バイアスに起因する問題が、一般化可能性です。

先ほどの例のように、大学病院の患者さんだけで試験をした場合に、クリニックの患者へ一般化できるかどうかが疑問になります

 

情報バイアス

情報バイアスとは、収集されたデータに偏りが生じてしまうことです。

 

例えば、非盲検で試験を実施した場合には、試験治療を知ることで先入観が生じたデータ収集がされてしまいます。

どういうことかというと、自分が実薬群であると患者さんがわかっている場合、ちょっとした不調であっても「薬のせいかもしれない」と思って、安全性情報を過剰に多く検出する可能性があります。

一方で、自分がプラセボ群であると患者さんがわかっている場合、ちょっとした不調の場合には「疲れているのかな」と思って、ただ睡眠を長めにとるだけかもしれません。

そうすると、安全性情報が不当に少なく検出される可能性があります。

 

また、飲酒歴や喫煙歴の自己申告は、過小申告の傾向があることが知られており、これらも情報バイアスの一つです。

 

とにかく、程度の大きさに関わらず、真実とかけ離れたデータが取られてしまうこと、というのが情報バイアスです。

 

交絡バイアス

交絡バイアスは、一番難しい概念ですね。

交絡バイアスを引き起こす因子を、交絡因子といい、以下の3つの条件を満たします。

 

  1. アウトカムに影響を与える
  2. 要因との関連がある
  3. 要因とアウトカムの中間因子ではない

 

交絡バイアスの詳細は別ページで詳しく説明しますが、ここでは一例だけ挙げておきます。

 

例えば解析の結果、飲酒と肺がんの間に強い関連性が認められたとします。

このとき、交絡因子として「喫煙」が可能性に上がります。

なぜなら、喫煙している人は肺がんを発症しやすいというデータがあります(1を満たします)。

そして、飲酒をする人には喫煙をする人が多い傾向にあります(2を満たします)。

また、飲酒すると必ず喫煙をする(中間因子である)ということはなく、飲酒の結果として喫煙をするわけではないので、中間因子ではありません(3を満たします)。

 

 

よって、喫煙が交絡因子となって、事実を歪めているのです。

 

 

バイアスは、試験の様々な段階で生じる可能性がある

バイアスは、あらゆる場面で生じる可能性があります。

例を挙げると、このような場面で生じる可能性があります。

 

  • 臨床試験の計画段階
  • 臨床試験の実施や解析の段階
  • 試験治療効果の評価の段階

 

例えば試験の計画段階であればどのようなバイアスが考えられますか。

症例の割付の仕方が不適切であり、リスクの低い患者が一方の試験治療に系統的に割付けられる場合などが挙げられますね。

 

 

バイアスが厄介な理由

偏りが厄介なのは、結果的にどの段階で偏りが生じたのかを、事後的に評価したり直接測定できず、排除することが出来ないという点です。

結果が出た後に「今回の結果にはこれだけバイアスが入っているから、それを考慮して結果を解釈しよう」ということができません。

つまり、その試験の結果が「バイアスを含んだ結果なのか、真の結果なのかを知ることはできない」ということです。

そのため、偏りとなる原因は事前に特定し、出来るだけ避けるための方策を考えなければなりません。

 

バイアスはどの段階で調整できるか

3つのバイアスを紹介しましたが、これらのバイアスはどの段階で排除できるでしょうか?

試験デザインで排除できるものと、解析でも排除できるものがあります。

以下の表にまとめてみました。

 

バイアス

研究デザイン

統計解析

選択バイアス

×

情報バイアス

×

交絡


選択バイアスと情報バイアスは、研究デザインを立案する時点で制御する必要があります。

データが収集された後では、そのバイアスを調整することができません。

一方、交絡は、研究デザインを立案する時点で制御したり、あるいは統計解析の時点で調整する事も可能です。

 

したがって、バイアスを調整するために最も重要なことは、データ収集を開始する前段階である研究計画を立案する時点で、バイアスの制御を考慮した研究デザインを立てる事です。

 

 

ランダム化と盲検化

臨床試験で偏りを回避するための最も重要な計画上の技法は、盲検化ランダム化です。

この「盲検化」と「ランダム化」は、承認申請に利用することを目的とするほとんどの比較臨床試験で標準的に採用すべきである、とICH E9でも書かれています。

承認申請を目的としなくても、論文化する時があると思います。

この時にも、盲検下とランダム化は重要です。

とくに疫学データはどちらもなされていないので、そのデータの解釈は、本当に注意が必要です。

 

身近にあるバイアスの例

実は、臨床試験だけじゃなくとも、バイアスの例は身近に存在します。

例えば、通販番組。

夜中に、ダイエット器具を紹介していることが多いですよね。

でも、あなたの周りを見渡してみて、通販番組のダイエット器具でダイエットに成功した人はいますか?

 

通販番組で集計データが用いられないのはなぜ?

通販番組の定番の構成は、モニターを5人程度登場します。

その人たちが、実際に器具を「使う前」と「使った後」の変化を、実際の映像を交えてアピールしています。

その中には、1カ月で5キロやせた人や、ウエストが10センチ細くなったという人が出てきますね。

そうすると、「私でも痩せることが出来るんではないか」という気持ちが湧いてきます。

その気持ち、すごく分かります。

でも、その気持ちに正直になって通販器具を購入しても、なぜか痩せない。。

 

じゃあ通販番組に出てくるモニターさんの前後の変化は嘘なのか?というと、恐らく本物です。

番組で嘘はついていないと思います。

 

しかしながら、ここで疑問を持ってもらいたいのです。

どこに疑問?というと、ここ。

 

モニターさんは5人程度である一方で、「売上XX万個突破!!」なんていう宣伝

 

なぜ疑問を持ってもらいたいか。

例えば、売り上げ個数が1万個だったとします。

すると、なぜ集計結果が番組ではアピールされないのでしょうか?

器具を売り上げた全員の体重を収集できないのは分かります。

ですが、1%でも匿名でアンケートを収集できれば100人分のデータが集められます。

それを集計したデータでアピールしたほうがとても説得力がありますがそれをしないのはなぜでしょうか?

 

テレビに出ているモニターさん達の心理を読み取ってみる

テレビで実際にその器具を使ったモニターさん。

先ほども述べた通り、体重やウエストの変化は本物だと思います。

しかし、そのモニターさんの心理を考えてみましょう。

 

もしあなたがモニターの一人になったとしたら、どう思いながら参加するでしょうか?

状況としては、テレビでその前後の体重やウエストの数字が日本中に放送されるのです。

また引っ込み思案な日本人ですが、そうやって日本中に放送されてでも、痩せたいと思っているのです。

そうなったとき、どういう心理でその器具のモニターになるでしょうか?

ちょっとだけモニターさんの意識を整理しましょう。

 

  • モニターになるということは、日本中でそのやせ具合を放送される。痩せないと、ただ醜態をさらしてしまうだけ、という意識がある。
  • そのやせ具合を放送されるのを許容してまでも、痩せたい!という強い意識がある。

 

どうですか。

このような意識があった時に、誰でも努力するとは思いませんか?

その器具じゃなくても、モニターになった時点で痩せる要素が実は備わっている可能性があるのではないでしょうか?

実はその器具を使う以外にも、「絶対痩せなければ!」という意識から、もしかしたら隠れて食事制限とかしているかもしれません。

 

専門的な用語でいうと、「選択バイアス」がかかっている可能性があるのです。

医薬研究の世界で「チャンピオンデータ」と呼ばれるデータです。

 

本当の効果は、比較しなければわからない

上記のように、通販番組のモニターさんはその器具の効果だけではなく、モニターになることで意識が改善され、その結果痩せた可能性があるのです。

実際の臨床試験でもそのようなことは多々あります。

臨床試験ではよくプラセボという、見た目は薬と全く一緒だが、薬効成分が入っていないものを使って、それに比べて新しい薬は効果があるか?ということを検証します。

実はこのプラセボというのは侮れません。

一般的に「プラセボ効果」と呼ばれるような、通販のモニターのような効果が表れることがあります。つまり、薬効成分が全く入っていないのに、効いてしまうのです。

そのため、我々は何かその効果を主張する際には、それが比較の結果であるか?ということを意識する必要があります。

何かと比較した結果であれば、多少は信じても良い結果であると考えてよいと思います。

 

まとめ

臨床試験では偏りを最小にするための計画を立てなければならない。

偏りを回避するための最も重要な方法は、盲検化とランダム化である。

論文化に必要な統計に絞った地図あります

 

  • パソコンに向かってもなぜか筆が進まない…
  • 学会発表は結構たくさんしているのに、なぜ論文が出ないのだろう…
  • こんなに忙しいのに、いつ論文を書いたらいいのか…
  • 一度は書いたはずの論文がお蔵入りに…どうすればいいの…
  • データはあるのになぜ論文化まで持っていけないんだろう…
  • このデータ、どうやって解析すればいいんだろう…

 

その悩みこの無料メルマガで全て解決するかもしれません

 

↓今すぐ無料で論文化までの最短距離を歩く↓

↑無料で論文化に必要な統計を最短で学ぶ↑