EZRでマンホイットニーのU検定!T検定との結果の違いも

EZRでマンホイットニーのU検定!T検定との結果の違いも

今日の記事は、マンホイットニーのU検定をEZRで実施する方法をお伝えします。

マンホイットニーのU検定はどんな検定だったか覚えていますか?

ウィルコクソンの順位和検定とやっていることは同じで、連続量を対象としたノンパラメトリック検定ですよね。

>>マンホイットニーのU検定を理解する!

では、連続量を対象としたパラメトリック検定は?

そう、T検定です。

>>T検定を理解する!

ということで、今回の記事はマンホイットニーのU検定をEZRで実施する方法に加えて、同じデータに対してT検定を実施した時の違いまで解説します。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

目次

EZRでマンホイットニーのU検定を実施するために必要となるデータを読み込む

まずは、マンホイットニーのU検定(以下、U検定)を実施するために必要なデータを解説します。

U検定は、2群の連続量を対象としたノンパラメトリック検定でした。

ということは、用意するデータは以下の2つを満たす必要があります。

  • 連続量のデータが必要。
  • 2群の群間比較をするので、2つのカテゴリを持つ、カテゴリカルデータが必要。

EZRでマンホイットニーのU検定を実施するのに使用するデータ

ということで、今回の記事で使うデータです。

今回はA群、B群の2つの群で、LDHの平均値を比較してみます。

(データは架空のデータです。)

実際には、T検定で実施したときと同じデータを使います。

LDHが連続データで、Groupが群を示した変数です。

A群13例、B群11で、計24症例分のデータがあります。

>>データのダウンロードはこちら

EZRにU検定を実施する基となるデータを読み込む

ではここから、EZRにデータを取り込みます。

まずは、サンプルデータを適切な場所に保存しておきましょう。

EZRを開き、「ファイル」→「データのインポート」→「ファイルまたはクリップボード, URLからテキストデータを読み込む」を選択します。

データセット名は「utest」にしましょう(実際はなんでもよい)。

そして「ローカルファイルシステム」と「カンマ」にチェックを入れてOKを押します。

データセットが「utest」になっていることを確認し、「表示」を押してデータが正しく表示されれば取り込み完了です。

無料で使える統計ソフトEZRでマンホイットニーのU検定を実践する!

解析するための準備が整いましたので、早速U検定を実施してみましょう。

U検定を実施するには、以下の手順で行います。

「統計解析」→「2群間の比較」→「Mann-Whitney U検定」

  • 目的変数(1つ選択)で「LDH」を選択します。
  • 比較する群(1つ以上選択)で「Group」を選択します。
  • 対立仮説は「両側」を選択します。
  • 検定のタイプは「デフォルト」でOKです。
  • 他は、いじらなくてOKです。

これで解析を実行すると、以下の解析を自動で行ってくれます。

  • マンホイットニーのU検定結果
  • 各群のレンジ、四分位範囲、中央値などの要約
  • 各群の箱ひげ図の作成

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

EZRで出力したU検定結果の解釈をしよう

実際にU検定が実施できました。

では、結果の解釈をしていきましょう。

U検定の結果解釈

まずはU検定の解析結果です。

まず、Wilcoxon rank sum testと書かれてあります。

「あれ、マンホイットニーのU検定じゃなかったっけ?」って思いますよね。

実は、マンホイットニーのU検定と、ウィルコクソンの順位和検定は同じことを実施しています

そのため、ウィルコクソンの順位和検定の結果が出ていたとしても問題ないので、あわてないでおきましょう。

>>ウィルコクソンの順位和検定とは?

Data: LDH by factor(Group)とあります。

これは、GroupごとにLDHを比較したという意味です。

そして次の行にはp値が表示されています。

0.0138というP値を得られました。

0.05より小さいため、有意水準を0.05に設定していた場合には、有意差ありという結論になります。

>>有意水準、P値、有意差の関係を深く理解する!

次の行には対立仮説が表示されていますね。

「true location shift is not equal to 0」とあります。

ウィルコクソン検定は、連続量データを“順位”に変換して解析する手法でした。

そのため、対立仮説のlocation shiftというのは、“順位変動”と読み替えていただければ理解できますね。

>>帰無仮説と対立仮説の理解は検定をするうえで必須です!

各群の中央値と四分位範囲の結果解釈

その次に、各群の中央値と四分位範囲が要約されています。

箱ひげ図も出力される

設定の際に、グラフは「箱ひげ」を出力するようにチェックを入れたので、箱ひげ図が作成されています。

詳細は箱ひげ図の記事を参照していただきたいのですが、簡単に解説します。

箱ひげ図は、箱の部分とひげの部分がある、かなり特徴的なグラフです。

箱が四分位範囲を示しています。

ひげは箱の1.5倍(それぞれ上側に1.5倍、下側に1.5倍の意味)の長さまでのデータの範囲を示しています。

ひげから外れたデータは、外れ値として示されています。

これを見るだけでも、データの分布がA群とB群で異なっていることが分かります。

同じデータでT検定を実施するとどうなるのか?

以上の手順で、マンホイットニーのU検定をEZRで実施することができました。

次なる疑問は、同じデータでT検定を実施すると結果はどうなるのか!?ということ。

今回はT検定を実施した際と同じデータを使用しましたので、P値を比較しましょう。

>>EZRでT検定を実施する方法はこちら!

同じデータでT検定を実施すると、P=0.00496が得られていますね。

つまり、T検定の結果の方が、P値が小さいことが分かります。

T検定とU検定の検定結果の違いはこのような関係になります。

データの分布T検定(パラメトリック)ウィルコクソンの順位和検定(ノンパラメトリック)
正規分布
正規分布ではない×

今回のデータは正規分布に近かったという考察ができます。

本当に正規分布なのか!?ということを確認するために、ヒストグラムを作成してみましょう。

データが正規分布に近いのか、EZRでヒストグラムを作成する

ヒストグラムを作成するためには、「グラフと表」→「ヒストグラム」を選択します。

変数(1つ選択)で「LDH」を選択します。

群別する変数(0~1つ選択)で「Group」を選択します。

あとは、いじらなくてOKです。

すると、以下のようなグラフが作成されました。

A群もB群も、真ん中が一番大きい山になり、そこから左右対称に例数が小さくなっているように見えます。

ということで、視覚的にも正規分布に近い、ということが確認できました。

EZRでマンホイットニーのU検定まとめ

今回は、EZRでマンホイットニーのU検定を実施しました。

同じデータでT検定を実施すると、今回のデータではT検定のP値の方が小さくなっています。

ヒストグラムを確認するとデータが正規分布に近い形をしていたため、この結果には納得です。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメントする

目次