MENU

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R で級内相関係数 ICC(2,1) を計算する方法と必要なサンプルサイズを計算する方法

級内相関係数 ICC Case2 の計算とサンプルサイズ計算を R でやってみた

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

目次

級内相関係数 ICC(2,1) の計算例

級内相関係数 Intra-class Correlation Coefficient Case2 ICC Case2 は検者間信頼性の指標。

患者さんを数名の検査者(または評価者)で検査(または評価)して、その測定値の一致性を見るのが主目的。

複数の検査者が各患者さん 1 回ずつ検査・評価した場合の ICC(2,1) が良く用いられる。

9人の患者さんをA~Eの5人の検査者で1回ずつ検査した時

irrパッケージのicc()を使う。

最初一回だけインストールする。

install.packages("irr")

データ拝借元:級内相関係数|統計解析ソフト エクセル統計

A <- c(0,2,2,1,3,0,4,4,6)
B <- c(0,4,1,2,3,1,5,4,6)
C <- c(0,2,0,0,3,0,4,4,6)
D <- c(0,2,2,1,3,0,4,5,4)
E <- c(0,3,2,1,3,0,4,4,6)
dat.twoway <- cbind(A,B,C,D,E)
rownames(dat.twoway) <- c(1:9)
print(dat.twoway)
library(irr)
icc(dat.twoway, model="twoway", type="agreement")

読み込んだデータは以下のようになっている

> print(dat.twoway)
  A B C D E
1 0 0 0 0 0
2 2 4 2 2 3
3 2 1 0 2 2
4 1 2 0 1 1
5 3 3 3 3 3
6 0 1 0 0 0
7 4 5 4 4 4
8 4 4 4 5 4
9 6 6 6 4 6

ICC(2,1) の計算結果は以下の通り。

> icc(dat.twoway, model="twoway", type="agreement")
 Single Score Intraclass Correlation

   Model: twoway 
   Type : agreement 

   Subjects = 9 
     Raters = 5 
   ICC(A,1) = 0.906

 F-Test, H0: r0 = 0 ; H1: r0 > 0 
  F(8,32.8) = 55.6 , p = 6.98e-17 

 95%-Confidence Interval for ICC Population Values:
  0.783 < ICC < 0.974

ICC(2,1)は、0.906と計算された。

高い一致度だ。

患者さん10人をA~Dの4人の検査者で膝関節屈曲可動域を検査した時

別のデータでICC(2,1)を計算してみる。

患者さん10人、A~Dの4人の検査者で、膝関節屈曲可動域を検査したデータだ。

データ拝借元:信頼性指標としての級内相関係数

A <- c(126,137,113,153,146,161,110,145,126,114)
B <- c(122,143,119,143,157,157,109,151,141,126)
C <- c(131,141,115,135,150,160,105,152,132,130)
D <- c(125,141,105,144,149,160,113,156,122,125)
dat.twoway <- cbind(A,B,C,D)
rownames(dat.twoway) <- c(1:10)
print(dat.twoway)
icc(dat.twoway, model="twoway", type="agreement")

データは以下のような感じになる

> print(dat.twoway)
     A   B   C   D
1  126 122 131 125
2  137 143 141 141
3  113 119 115 105
4  153 143 135 144
5  146 157 150 149
6  161 157 160 160
7  110 109 105 113
8  145 151 152 156
9  126 141 132 122
10 114 126 130 125

計算結果は以下の通り。

> icc(dat.twoway, model="twoway", type="agreement")
 Single Score Intraclass Correlation

   Model: twoway 
   Type : agreement 

   Subjects = 10 
     Raters = 4 
   ICC(A,1) = 0.909

 F-Test, H0: r0 = 0 ; H1: r0 > 0 
    F(9,30) = 40.4 , p = 2.46e-14 

 95%-Confidence Interval for ICC Population Values:
  0.788 < ICC < 0.973

ICC(2,1)は0.909と計算された。

こちらも一致度が高い。

irrパッケージのanxietyデータを使った例

20人の患者さんを3人の評価者が評価した結果のICC。

data(anxiety)
print(anxiety)
icc(anxiety, model="twoway", type="agreement")

anxiety データセットは以下のとおり

> print(anxiety)
   rater1 rater2 rater3
1       3      3      2
2       3      6      1
3       3      4      4
4       4      6      4
5       5      2      3
6       5      4      2
7       2      2      1
8       3      4      6
9       5      3      1
10      2      3      1
11      2      2      1
12      6      3      2
13      1      3      3
14      5      3      3
15      2      2      1
16      2      2      1
17      1      1      3
18      2      3      3
19      4      3      2
20      3      4      2

ICC(2,1)は0.198とかなり低い一致度。

> icc(anxiety, model="twoway", type="agreement")
 Single Score Intraclass Correlation

   Model: twoway 
   Type : agreement 

   Subjects = 20 
     Raters = 3 
   ICC(A,1) = 0.198

 F-Test, H0: r0 = 0 ; H1: r0 > 0 
 F(19,39.7) = 1.83 , p = 0.0543 

 95%-Confidence Interval for ICC Population Values:
  -0.039 < ICC < 0.494

級内相関係数 ICC(2,1) のサンプルサイズ計算

級内相関係数 ICC(2,1) のサンプルサイズ計算はどうやるのだろうか?

参考文献 Doros G. and Lew R. Design Based on Intra-Class Correlation Coefficients. Am J Biostatistics 2010: 1 (1); 1-8.に計算結果が掲載されている。

検査者が3人、5人、7人、10人のとき、信頼区間全体の平均幅 $ \Delta $ が0.2、0.3、0.4のときのサンプルサイズが計算されている。

信頼区間の有意水準が10%($ \alpha $ = 0.1)のときと5%($ \alpha $ = 0.05)の時が計算されている。

ICC(2,1)の推定値 $ \rho $ が0.6、0.7、0.8のときがそれぞれ計算されている。

例えば、検査者が3人(k=3)で、信頼区間幅が0.4で推定したいとする。

有意水準5%つまり95%信頼区間で推定するとして、$ \rho $ が 0.8 と推定されるとすると、必要なサンプルサイズ(患者さんの人数)は14人である。

参考文献にはスクリプトの請求が可能と書いてあった。

論文に掲載されていない数値に関しては、各自スクリプトを取り寄せて、スクリプトを確認の上、計算してもらいたい。

計算における注意点

実際の計算には、variance ratio $ \sigma_T^2 / \sigma_E^2 $ 、想定する ICC(2,1) の値 $ \rho $ が必要になる。

$ \rho $ と variance ratio には、以下の関係がある。

$$ \rho = \frac{\sigma_T^2 / \sigma_E^2} {\sigma_T^2 / \sigma_E^2 + \sigma_J^2 / \sigma_E^2 + 1} $$

ここで、

  • $ \sigma_T^2 $: variance of normally distributed random target effects(目標とする効果の分散)
  • $ \sigma_J^2 $: variance of normally distributed random rater effects(評価者効果の分散)
  • $ \sigma_E^2 $: variance of normally distributed measurement errors(誤差の分散)

である。

論文中では、variance ratio を pilot study から持ってきている。

Pilot study がない場合、この variance ratio を見極めるのが難しそうだ。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

まとめ

級内相関係数 ICC(2,1) の計算例とサンプルサイズ計算の方法を解説した。

参考になれば。

参考文献

Doros G. and Lew R. Design Based on Intra-Class Correlation Coefficients. Am J Biostatistics 2010: 1 (1); 1-8.

参考サイト・PDF

級内相関係数 | 統計解析ソフト エクセル統計

信頼性指標としての級内相関係数

Sample Size Determination for ICC(2,1)

How should we calculate sample size for ICC(2,1) analysis?

A part of sample size calculation for ICC(2,1) with certain conditions were published in the following scientific article:

Doros G. and Lew R. Design Based on Intra-Class Correlation Coefficients. Am J Biostatistics 2010: 1 (1); 1-8.

The article showed results of sample size calculation under the condition estimating the confidence intervals of 0.2, 0.3, or 0.4 with two, three, or four raters.

Results with 10% and 5% of alpha levels were exhibited in Table 2 of the article. 

Estimates $ \rho $ of 0.6, 0.7, or 0.8 were demonstrated. 

For example, if you would estimate $ \rho $ = 0.8 with 0.4 of 95% confidence interval rated by four examiners, 14 patients would be needed as we can see a highlighted number in the following.

The reference said anyone can request R scripts for the calculation.

Please obtain and confirm the scripts, and perform calculation individually for any settings not included in the paper.

Reference

Doros G. and Lew R. Design Based on Intra-Class Correlation Coefficients. Am J Biostatistics 2010: 1 (1); 1-8.

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

コメント

コメントする

目次