個々の統計検定の説明

対応のあるデータ・対応のないデータとは?例を用いてわかりやすく解説!

この記事では「対応のあるデータ・対応のないデータとは?例を用いてわかりやすく解説!」ということでお伝えしていきます。

 

  • 対応のあるデータとは?対応のないデータとは?違いって何?
  • 対応のあるt検定と対応のないt検定をわかりやすく解説
  • その他の対応のある検定

 

これらのことがわかるようになりますので、ぜひ最後まで見ていってくださいね!

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

対応のあるデータとは?対応のないデータとは?例を用いて解説

まずは対応のあるデータと、対応のないデータがどんなものなのかを整理していきましょう。

 

対応のあるデータとは?

対応のあるデータを一言で言うと「同一のサンプルから得られているデータ」ということ。

例えば、今日のある豚さんの値と、一週間後の同じ豚さんの値を比較したい時。

この場合、サンプルとしては同一ですが、時点だけ異なるデータになります。

この時のデータを、対応のあるデータと呼んでいるのです。

 

上記の例は、臨床研究でもよくありますよね。

「A群」という同じグループ(サンプル)のデータを比較するため、対応のあるデータになります。

 

対応のないデータとは?

では一方で、対応のないデータとはどんなデータでしょうか?

それは「異なるサンプルから得られているデータ」です。

時点は同じでもよく、とにかく異なるサンプルから取られているデータを比較したい時には、対応のないデータの比較をする、ということになります。

 

これも臨床研究でよくある状況ですよね。

「A群」と「B群」という違うグループのデータを比較するため、対応のないデータの比較になるのです。

 

対応のあるt検定と対応のないt検定をわかりやすく解説

対応のあるデータや対応のないデータを調べていくと、t検定についての記載が多いことに気付きます。

「もしかしてt検定っていろんな種類があるのかな?」と勘違いしてしまうほど。

  1. 1群のt検定
  2. 対応のある2群のt検定
  3. 対応のない2群のt検定

この3つのt検定、一度は目にしたことありませんか?

 

対応のあるt検定も対応のないt検定も、やっていることは本質的に同じ

t検定がまるで3種類あるかのように見えますが、これらは全て本質的に一緒です。

本質的に一緒であることを理解するために、まずはそれぞれの帰無仮説を整理してみましょう。

  1. 1群のt検定:A群の身⻑の母平均 = 定数
  2. 対応のある2群のt検定:A群の時点1の母平均 = A群の時点2の母平均
  3. 対応のない2群のt検定:A群の身⻑の母平均 = B群の身⻑の母平均

 

そして、上記の帰無仮説の右辺を左辺に移項させてみます。

  1. 1群のt検定:A群の身⻑の母平均 -定数 = 0
  2. 対応のある2群のt検定:A群の時点1の母平均 – A群の時点2の母平均 = 0
  3. 対応のない2群のt検定:A群の身⻑の母平均 – B群の身⻑の母平均 = 0

 

これを見ても明らかなように、「どれ」と「どれ」を比較しているかが異なるだけで、やっていることは同じなんです。

 

特に「対応のある2群のt検定」は混乱を起こしそうな言葉

その中でも、「対応のある2群のt検定」ってかなり誤解を招く表現だなと思います。

なぜなら、対応のある2群のt検定は、時点1のデータを「群1」、時点2のデータを「群2」として「2群」とカウントしているからです。

でも、対応のあるデータとは「同一サンプル(同一の群)」から得られている、時点だけが違うデータのことでした。

つまり、群って1つです。

あくまで違うのは「時点」だけ。

なので本質的には、時点1と時点2の変化量に対して1群のt検定をやっているのと一緒なんです。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

その他の対応のあるデータに対する検定

対応のあるt検定の他にも、対応のあるデータに対する検定があります。

有名なのは以下の3つ。

  1. ウィルコクソンの符号付順位和検定
  2. 反復測定分散分析
  3. フリードマン検定

 

ウィルコクソンの符号付順位和検定については注意が必要です。

というのも、ウィルコクソンの順位和検定、というのもあるから。

「符号付」が付くと、対応のある検定。

「符号付」が無いと、対応のない検定。

違いは理解しておきましょう!

 

そして反復測定分散分析やフリードマン検定なんかもたまに見ますね。

それほど頻繁に見るような検定ではないので、「そんなのもあるんだ」ぐらいの認識でOKです!

 

まとめ

いかがでしたか?

この記事では「対応のあるデータ・対応のないデータとは?例を用いてわかりやすく解説!」ということでお伝えしました。

 

  • 対応のあるデータとは?対応のないデータとは?違いって何?
  • 対応のあるt検定と対応のないt検定をわかりやすく解説
  • その他の対応のある検定

 

これらのことがわかるようになったのなら幸いです!

 

こちらの内容は動画でも解説していますので、併せてご確認くださいませ。

 

今だけ!いちばんやさしい医療統計の教本を無料で差し上げます

第1章:医学論文の書き方。絶対にやってはいけないことと絶対にやった方がいいこと

第2章:先行研究をレビューし、研究の計画を立てる

第3章:どんな研究をするか決める

第4章:研究ではどんなデータを取得すればいいの?

第5章:取得したデータに最適な解析手法の決め方

第6章:実際に統計解析ソフトで解析する方法

第7章:解析の結果を解釈する

 

もしあなたがこれまでに、何とか統計をマスターしようと散々苦労し、何冊もの統計の本を読み、セミナーに参加してみたのに、それでも統計が苦手なら…

私からプレゼントする内容は、あなたがずっと待ちわびていたものです。

 

↓今すぐ無料で学会発表や論文投稿までに必要な統計を学ぶ↓

↑無料で学会発表や論文投稿に必要な統計を最短で学ぶ↑

POSTED COMMENT

  1. […] これは「現在の体重」と「3年後の体重」の対応のあるデータをBland-Altmanプロットとして示したもの。 […]

  2. […] ウィルコクソンの符号付順位和検定(Wilcoxon signed rank test)は、対応のあるt検定のノンパラメトリック版です。 […]

  3. […] 「対応あるデータ」とは、同一のサンプルから得られたデータである、という意味です。 […]

COMMENT

メールアドレスが公開されることはありません。