Oops! It appears that you have disabled your Javascript. In order for you to see this page as it is meant to appear, we ask that you please re-enable your Javascript!

2群の比較はどうすればいい?集計・検定・回帰分析まで。

あなたの手元に2群のデータがあったとき。

どんな解析をすればいいのか・・・

と、途方に暮れることがありますよね。

 

私も統計を仕事にする前、大学生のころなどは「このデータで何をすればいいのか・・・」と途方に暮れっぱなしでした。

 

今では、データがあったときにやるべきことが整理されています。

そのため、私が今でも実践していることをすべてお伝えします。

 

2群のデータに対して、この記事に書いていることを実践していれば、かなり良いレポートになるはずです!

 

スポンサー検索

どんなデータが2群のデータなのか?

まずは、どんなデータが2群のデータか。

「2群」というのは、「2種類」とか「2つの集団」とかに言い換えることができます。

つまり、比較したい2つの集団、ということですね。

 

例えば。

  • 男性と女性で糖尿病発症率を知りたい
  • プラセボ群と実薬群で死亡率の違いを知りたい
  • 日本とアメリカで所得の違いを知りたい

 

これらの例では「男性と女性」「プラセボ群と実薬群」「日本とアメリカ」で違いを知りたいわけです。

知りたい集団が2つですよね。

だから、これらのデータは「2群」のデータと呼ばれます。

 

以下の表にまとめてみましたので、ご参照まで。

 

1つ目の群 2つ目の群
男性と女性 男性 女性
プラセボ群と実薬群 プラセボ群 実薬群
日本とアメリカ 日本 アメリカ

 

 

スポンサーリンク

実際に2群のデータに対してどんな解析をやるのか?

では2群のデータがどんなものか分かったところで、実際のデータ解析方法を学んでいきましょう。

私が2群のデータを解析するときには以下のようなことをやります。

 

  1. まずは各群のデータを確認する
  2. 検定をする
  3. 回帰分析をする

 

これだけです。

やること少ないですよね。

 

検定を数種類やっていますが、この記事では「データをまとめる」ということを重視しています。

つまり、検証的試験のように、検定で0.05を下回るかどうかは重要視していません

あくまで検定結果は参考程度に見ます

そのため、多重性に関しても考慮しておりません。

 

多重性に関してはこちらの記事をご覧ください。

 

一番優しい、医薬品開発に必要な統計学の教本

多重性という言葉を聞いたことがありますか?知っている方も、どうすればそれを回避できるか知っていますか?色々と知っているこ…

 

 

解析1:まずは各群のデータを確認する

最終的には2群のデータを比較したいのですが、まずは各群のデータを確認することをやります。

例えば、「男性と女性で糖尿病発症率を知りたい」のであれば、「男性のデータを確認する」ことと「女性のデータを確認する」ということをやる、ということです。

 

具体的にどんな方法で確認すればよいのか?ということを知りたいですよね。

私はこれらをやります。

 

連続量の場合

  1. 要約統計量を算出する
  2. ヒストグラムを作成する
  3. 箱ひげ図を作成する

 

カテゴリカルデータの場合

  1. 分割表を作成する
  2. 棒グラフを作成する

 

要約統計量を算出する

連続量の場合、要約統計量を算出します。

「男性」と「女性」でそれぞれ算出します。

 

代表的な要約統計量はこちらの記事をご参照ください。

一番優しい、医薬品開発に必要な統計学の教本

統計学の重要な役割の一つに、データを要約するということがあります。統計と言えば平均値を出すだけ?いえいえ、それだけでは大…

 

私であれば、以下のような表を作成します。

男性 女性
平均値(SD) XXX(XX) YYY(YY)
中央値 XXX YYY
範囲 XXX-XXX YYY-YYY
四分位範囲 XXX-XXX YYY-YYY
95%信頼区間 XXX-XXX YYY-YYY

 

ヒストグラムを作成する

その次に、グラフを作成します。

要約統計量で、ざっくりとしたデータの把握ができました。

ですが、人は視覚的な情報があったほうが、把握をしやすいです。

そのため、データを視覚的に見ることができるように、グラフを作成します。

 

まずはヒストグラムですね。

ヒストグラムを作成することで、データの分布が分かります。

データが正規分布に近い形なのか。

それとも、右(左)に裾を引いているのか。

そんなことを把握します。

 

ヒストグラムの作り方は、こちらをご覧ください。

一番優しい、医薬品開発に必要な統計学の教本

・ヒストグラムから何がわかるの? ・ヒストグラムの作り方がわからない・・・ ・そもそも、何で統計が必要なの?   私の元…

 

箱ひげ図を作成する

もう一つのグラフである、箱ひげ図も重要です。

箱ひげ図を作成することにより、データの範囲や中央値や外れ値の有無まで分かってしまうので、かなり便利です。

 

箱ひげ図の作成方法はこちらをご参照ください。

一番優しい、医薬品開発に必要な統計学の教本

統計を勉強していると、必ず出てくる箱ひげ図。 統計検定2級でも、必ずといっていいほど問題が出題されます。 箱ひげ図はデー…

 

分割表を作成する

データがカテゴリカルデータであれば、要約統計量の代わりに分割表を作成します。

分割表に関してはこちらの記事を確認してください。

一番優しい、医薬品開発に必要な統計学の教本

カテゴリデータの解析では必須の分割表。分割表について分かりやすく解説しています。 …

 

棒グラフを作成する

カテゴリカルデータであっても、可視化することは重要です。

そのため、棒グラフを作成しましょう。

 

以下のようなグラフですね。

縦軸に数や割合を表示するグラフです。

 

 

スポンサーリンク

統計的検定を実施する

各群のデータが把握できたところで、初めて検定をやってみます。

 

連続量のデータであれば以下の二つを実施します。

  1. T検定
  2. ウィルコクソン検定

 

カテゴリカルデータであれば、以下の二つを実施します。

  1. フィッシャーの正確確率検定
  2. カイ二乗検定

 

T検定の実施

連続量で2群の比較といえば、まずはT検定ですよね。

そのため、基本の検定としてT検定の知識は持っておいてください。

 

詳しくはこちらの記事で。

一番優しい、医薬品開発に必要な統計学の教本

統計の世界では最も有名な検定であると言っても過言ではない、T検定。このページでは、T検定について解説します。検定は、帰無…

 

ウィルコクソン検定の実施

次は、ウィルコクソン検定を実施してみます。

ウィルコクソン検定はノンパラメトリック検定ですよね。

そのため、1つ前に実施したT検定結果と比較して以下のことを把握することができます。

 

「データが正規分布に近ければ、T検定のP値とウィルコクソン検定のP値は似た数値になる。」

 

反対に、T検定のP値とウィルコクソン検定のP値が大きく異なれば、データは正規分布に近くないということです。

その場合には、ウィルコクソン検定のP値を信頼しましょう。

 

ウィルコクソン検定についてはこちらの記事をご参照ください。

一番優しい、医薬品開発に必要な統計学の教本

今日は、ウィルコクソンの順位和検定について!ノンパラメトリックな検定では一番目にするのではないかと思います。でも、ノンパ…

 

フィッシャーの正確確率検定、カイ二乗検定の実施

データがカテゴリカルデータであれば、検定は2つです。

フィッシャーの正確確率検定とカイ二乗検定です。

2つの検定の使い分けですが、分割表を作成した際に5以下のセルがあれば、フィッシャーの正確確率検定を使います。

それ以外では、カイ二乗検定でOKです。

 

使い方も含め、詳しくは以下の記事を参照してください。

フィッシャーの正確確率検定についてはこちら。

一番優しい、医薬品開発に必要な統計学の教本

分割表で使われるフィッシャーの正確確率検定を簡単にわかりやすく解説しています。この記事を読むことで、分割表で有名なカイ二…

 

カイ二乗検定についてはこちら。

一番優しい、医薬品開発に必要な統計学の教本

カテゴリデータの解析では必須の分割表。分割表について分かりやすく解説しています。 …

 

 

回帰分析を実施する

最後には回帰分析をします。

回帰分析をする理由としては、単純な検定だけでは分からないことを知るためです。

単純な検定だけでは分からないこと、というのは具体的には「交絡」を気にしています。

 

交絡に関してはこちらの記事をご覧ください。

一番優しい、医薬品開発に必要な統計学の教本

交絡因子は医学統計において、かなり重要な知識であるにも関わらず、とてもイメージしにくいです。「交絡」「交絡因子」「交絡バ…

 

交絡の例も確認すると、理解が深まります。

一番優しい、医薬品開発に必要な統計学の教本

交絡因子は医学統計において、かなり重要な知識であるにも関わらず、とてもイメージしにくいです。「交絡」「交絡因子」「交絡バ…

 

交絡を排除する方法として共分散分析があります。

共分散分析は回帰分析の方法の一つです。

 

共分散分析の詳細はこちらの記事をご覧ください。

一番優しい、医薬品開発に必要な統計学の教本

共分散分析という解析手法があります。英語ではAnalysis of Co-Varianceと呼ばれるため、省略してANC…

 

 

まとめ

私が2群のデータを解析するときの方法を余すことなく記載しました。

これらをやるだけで、ちゃんとした報告書やレポートができますので、ぜひ実践してみてください。

 

  1. まずは各群のデータを確認する
  2. 検定をする
  3. 回帰分析をする

 

統計検定2級の解説付き

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メールセミナー。