MENU

EZR と SPSS で前後 2 時点の対応のあるデータを共分散分析で群間比較する方法

前後2時点の対応のあるデータを群間比較するときは、共分散分析を使う

EZR と SPSS の方法を解説

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

対応のあるデータの群間比較の考え方

対応のあるデータの群間比較の際に、考え方が2つある。

一つは、後のデータを目的変数に、群別変数を着目する説明変数に、前のデータを共変量にする方法。

群別変数も共変量も、ともに説明変数である。

もう一つは、前後の差のデータを目的変数に、群別変数を着目する説明変数に、前のデータを共変量にする方法。

後のデータや、前後の差のデータを群間比較するだけだと、前のデータの群間における偏りが考慮できない。

そんなときに、共分散分析を使うと、前のデータを考慮に入れながら、群間比較できるわけだ。

EZRで実際にやってみる

EZR公式マニュアルのデータを使って、対応のあるデータで群間比較を行ってみる。

データは、CDratio1, CDratio2が対応のあるデータ、AGVHD24が群別変数とする。

CDratio1とCDratio2の差は、Diff という名前であらかじめ作成しておく。

後の測定値を目的変数にする場合

「統計解析」→「連続変数の解析」→「共分散分析」を選択する。

目的変数にCDratio2, 比較する群にAGVHD24, 補正に用いる連続変数にCDratio1とする。

これでOKをクリックすると解析結果が出力される。

まず、群別変数と共変量の間の交互作用の検討が行われる。

有意水準を5%とすれば、交互作用があるとは言えないということになり、解析を群別に分けなくてもよいという判断になる。

CDratio1で調整した、AGVHD24の2群の分散分析という形になる。

有意水準を5%とすれば、AGVHD24は統計学的有意ではなく、群間差はないという結果になる。

グラフが同時に出力されており、青 (AGVDH24=0) の回帰直線とピンク (AGVHD24=1) の回帰直線がほぼ同じであることがわかり、ここからも、2群が異ならないことがわかる。

前後差を目的変数にする場合

前後差を目的変数にする場合は、先ほど CDratio2 とした目的変数を Diff に変える。

交互作用と群別変数のp値は、ともに先ほどと同じ結果になる。

なので、目的変数に後のデータを使うか、前後の差を使うかに、本質的には違いがないと言える。

グラフは、先ほどとは異なり、右肩下がりになった。

これは、CDratio1が大きいほど、変化量は小さいという関係性が示されている。

しかしながら、群間には違いがないのは先ほどと同じである。

EZRで重回帰式のパラメータを推定する方法

共分散分析のメニューを使うと、重回帰式のパラメータを推定することができない。

回帰直線の傾きや切片が知りたい場合は、「統計解析」→「連続変数の解析」→「重回帰」を選択する。

目的変数には、CDratio2かDiffを入れる。

説明変数にはAGVHD24とCDratio1を入れる。

Controlキーを押しながらクリックすると複数選択できる。

OKを押すと、解析結果が出力される。

以下の部分のCDratio1の回帰係数推定値が傾きである。

AGVHD24の数値は、1のグループでは、回帰係数推定値分だけ足される。

今回の場合は係数がマイナスなので、引かれる形になる。

この場合は、傾きは平行であることを前提としていて、AGVHD24の回帰係数推定値分がY軸方向に水平移動になる。

前後差を目的変数にすると、以下のような結果になる。

ちなみに、重回帰分析であっても、共分散分析であっても、p値は同じなので、どちらを使っても本質的には同じでどちらでもよいことがわかる。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

SPSS で共分散分析を行う方法

一般線型モデルメニューを使う場合

前後差を目的変数にした方法を実行してみる。

まずは一般線型モデルのメニューを使う。

以下のように従属変数にDiff、固定因子にAGVHD24、共変量にCDratio1を投入する。

オプションをクリックし、パラメータ推定値にチェックを入れる。

これで分散分析の結果だけでなく、パラメータ推定を出力してくれる。

続行をクリックして、OKをクリック。

パラメータ推定値の表がメインの表である。

AGVHD24の有意確率は、上記のものと同じだが、推定値Bは、-がついておらず符号が逆である。

これは、AGVHD24=1が参照カテゴリになっているためである。

一般線型モデルのメニューはこれを自由に指定できない。

逆にしたい場合は、変数の0と1を逆にしておく必要がある。

回帰 → 線型 メニューを使う場合

次に、回帰→線型のメニューを使ってみる。

従属変数にDiff、独立変数にAGVHD24とCDratio1を投入する。

OKをクリックすると結果が出力される。

係数というタイトルの表がメインの結果表である。

今度は、AGVHD24の有意確率のみならず、Bの値も符号を含めてEZRの結果と同じになる。

このとき、AGVHD24=0が参照カテゴリになって、1のときに-2.747という意味である。

これのほうがわかりやすい。

だが、回帰→線型のメニューは、1/0のデータはこれでよいが、3群以上のカテゴリの際にはダミー変数を作成して、適切に投入しないといけない。

これがややこしい点である。

慣れれば大したことないが、ダミー変数とは何か?

なぜカテゴリカルデータの1,2,3をそのまま入れてはダメなのか?

を理解する必要があるので、SPSSのこのメニューはハードルが高く使いづらい。

このような一長一短はあるにせよ、SPSSでも対応のあるデータの群間比較を共分散分析で解析することができる。

ちなみに、共分散分析は、一般線型 (線形でも同じ) モデルとも呼べるし、カテゴリカルデータをダミー変数にして投入した重回帰分析とも言える。

まとめ

対応のあるデータの群間比較を共分散分析で解析する方法を紹介した。

後のデータか、前後の差のデータの解析したいほう (多くの場合は変化量を問題にしたいのではなかろうか?その場合は差を用いるとよい) を目的変数として、群別変数と前のデータを説明変数とする。

EZRで分散分析の結果だけでよければ、共分散分析のメニューを使う。

傾きや切片の推定を行いたければ、重回帰のメニューを使う。

SPSSでは、一般線型モデルか、回帰→線型メニューを使えば実行可能。

対応のあるデータを群間比較したいが、対応のあるt検定では群間比較できない!どうしたらいい??ってなったときに、この方法を使うと解決する。

参考書籍

EZR公式マニュアル

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメントする

目次