分かりやすい分割表

ROC曲線とは?カットオフ値の決め方やAUCの意味まで簡単に解説!

ROC曲線とは?カットオフ値の決め方やAUCの意味まで簡単に解説!

最近はPCR検査という今まで普通の人が知らなくて済んだ言葉が日常用語になるような異常な世の中になっているこの頃。

PCR検査を行なうと下の表のように偽陰性などが出るというのは耳にされた方が多いのではないでしょうか。

疾患あり 疾患なし
検査 : 陽性 真陽性 偽陽性
検査 : 陰性 偽陰性 真陰性

これから解説するROC曲線というものを使うと、PCR検査の有効性を分析することができるのでしっかり覚えておきましょう。

ROC曲線とは、receiver operating characteristicの略で、もともとはレーダー信号のノイズの中から敵機を発見するための技術から発達したもの。

よくある軍事技術の民間転用の一つですね。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1,000人以上の医療従事者が購読中

ROC曲線とは?感度と特異度を考慮した曲線

まず用語の定義から始めます。

  • 真陽性:実際に疾患がある人が陽性と判断されること
  • 偽陽性:実際には疾患がない人が陽性と判断されること
  • 偽陰性:実際に疾患がある人が陰性と判断されること
  • 真陰性:実際には疾患がない人が陰性と判断されること
疾患あり 疾患なし
検査 : 陽性 真陽性(A) 偽陽性(B)
検査 : 陰性 偽陰性(C) 真陰性(D)

上の表の記号を使って真陽性率を算式であらわすと、真陽性率=A/(A+C)となり、これを感度と呼びます。

また、真陰性率=D/(B+D)となりこれを特異度と呼びます。

このとき、1-特異度=B/B+D)となり、これを偽陽性率と呼びます。

上のグラフのように横軸(0から1まで)に1-特異度、縦軸(0から1まで)に感度をプロットし、カットオフ値(検査の基準値)を連続的に変化させた際に描かれる曲線(上のグラフでは青い色の線)のことをROC曲線と呼びます

ROC曲線とは、感度(真陽性率)と1-特異度(偽陽性率)の関連を表す曲線

 

PCR検査でROC曲線を考える

カットオフ値を下げれば下げるほど感度 (=陽性率) は高くなる、という性質があります。

PCR検査の例でいえば「唾液中のウイルス遺伝子量20フェムトグラム/デシリットル以上」がであれば検査陽性になりますが、、1フェムトグラムとは1グラムの1000兆分の1のことなのでほとんどないに等しいということを意味します。

ほとんどの人がこの基準を満たしますから、感度は限りなく1に近づきます。

その一方で、特異度は極めて小さく、0に近いはず。

すなわち、1-特異度は1に近い数値になります。したがって、このカットオフ値はROC曲線でいえば右上の部分にプロットされます。

ではここから、カットオフ値を徐々に上に上げていきましょう。

 

例えば以下のような図だと、疾患ありの8人の中で、陽性になる人は7人ですから、感度は7/8=87.5%になります。

一方で疾患なしの7人のうち、4人が検査陰性になるので、特異度は4/7=57%になります。

つまり、カットオフ値を上げれば上げるほど感度 (=陽性率) は低くなるのですが、特異度は上がっていく。

そしてカットオフ値を1番上まで持っていくと、感度は0になり、特異度は100%になります。

これは「感度と特異度はトレードオフの関係がある」ということです。

 

このようにして、カットオフ値を変化させていけば、左下から徐々に右上に向かう、以下のような形状の曲線になるのです。

ROC曲線は、このように一辺の⻑さが1の正⽅形の中に定義される曲線です。

ROC曲線は、でたらめな検査であれば45度の直線になり、有効な検査であれば45度の線から左上に離れた曲線になります。

ROC曲線が45度の線から左上に離れれば離れるほど検査は有効性が高いということになるのです。

ROC曲線から計算するAUCの意味は?


次にAUC(Area Under the Curve)という概念について説明します。

AUCとは、ROC曲線の下側の⾯積のこと。

ROC曲線とは偽陽性率と真陽性率が基準値に対してどのように変化するかを示す曲線なので、ROC曲線を用いて算出されるAUCはある検査がどれくらい有用性があるのかの指標となるのです。

AUCとは、ROC曲線の下側の⾯積

 

なぜROC曲線を用いて算出されるAUCが検査の有用性の指標となるのか?

AUCはROC 曲線の下の面積ですので、ROC 曲線の性質から、でたらめな検査のときにAUCが0.50になり、完璧な検査のときにAUCは1になることが理解できるかと。

このように、疾患ありと疾患なしを識別できる程度が ROC 曲線下の面積に反映されるため、AUCにより検査の総合的な評価を行うことが可能となります。

AUCは、検査の総合的な性能を1つのスコアにカットオフ値によらない形で実現した指標と言えるでしょう。

>>もう統計で悩むのは終わりにしませんか? 

↑1,000人以上の医療従事者が購読中

ROC曲線からカットオフ値の決め方は?

ROC曲線からカットオフ値の決め方について主に2つを理解しよう

では、ROC曲線からカットオフ値を決めるにはどうしたらいいか。

ROC曲線からカットオフ値を決める方法はいくつかありますが、ここでは①グラフの左上、座標でいうと(0,1)からの距離を最小にする方法と、②Youden’s indexというものを用いた方法の2とおりの方法をご紹介します。

ROC曲線からカットオフ値の決め方1:左上の隅の点からの距離が最小となる方法

この方法は、後述するYouden’s indexと違ってスマートな名前がありません。

とりあえず、「左上の隅の点からの距離が最小となる方法」としておきます。

感度と1-特異度という2つの変数からなるROC曲線は、これまで説明したとおり、45度の線から左上に離れれば離れるほど検査としての有効性が上がることが理解できるのでは。

したがって、左上の隅(0,1)との距離が最小となる点をカットオフ値にするという方法が、まず一つの方法としてあり得るのです。

これはスマートな名前がなくて覚えにくいですが、内容は結構シンプルですよね。

ROC曲線からカットオフ値の決め方2:②Youden’s index

次にYouden’s indexというものについて説明します。

これは感度も特異度も高いほうがいいと考えて、(感度+特異度)が最大になる点を最適点と定義する方法です。

具体的には、最も検査の有効性が低いROC曲線、すなわちAUC = 0.5となる45度の線から最も離れたポイントをカットオフ値にすればいいということ。

45度の線から縦軸方向の距離を計算すると(感度+特異度-1)となりますが、これが最大値となるポイントをカットオフ値にしてしまえばいい。

これは、①の方法の逆の考え方になっています。この(感度+特異度-1)が最大値となる点をYouden indexと言います。

これはちゃんと名前が付いていて覚えやすい。

まとめ

ROC曲線は、検査や診断薬の性能最適な境界値を推定する方法のひとつです。

ROC曲線は感度と特異度しか考慮しませんが、複数の検査項目のROC曲線をひとつのグラフ上に描くことができるため、複数の検査項目について診断指標としての性能を比較することができます。

ROC曲線は、検査や診断薬の性能最適な境界値を推定する方法のひとつですが、実は万能な方法ではありません。

そんな神のような完璧な方法があるわけないですよね。

ですが、直観的に理解しやすく扱いやすい手法と言えます。

どんな方法にも短所と長所がありますので、それぞれの研究目的に合った方法を選択する必要があるのです。

ROC曲線を用いた分析手法を皮切りにさまざまな分析手法を勉強していきましょう。

 

>>JMPでROC曲線を作成する方法!

学会発表や論文投稿に必要な統計に絞りました

 

  • パソコンに向かってもなぜか筆が進まない…
  • 学会発表は結構たくさんしているのに、なぜ論文が出ないのだろう…
  • こんなに忙しいのに、いつ論文を書いたらいいのか…
  • 一度は書いたはずの論文がお蔵入りに…どうすればいいの…
  • データはあるのになぜ論文化まで持っていけないんだろう…
  • このデータ、どうやって解析すればいいんだろう…

 

その悩みこの無料メルマガで全て解決するかもしれません

 

↓今すぐ無料で学会発表や論文投稿までに必要な統計を学ぶ↓

↑無料で学会発表や論文投稿に必要な統計を最短で学ぶ↑

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です