自由度とは??求め方とその解説を5分で理解できます!

χ二乗検定が出てきたので、ちょっと自由度の話をします。

自由度って、何となく分かるようで分からないですよね。

ちなみに私は、この自由度の概念がわかるまで3年ぐらいかかりました。。。

というのも、本を読んでも全然イメージができなかったのです。

でもあなたは大丈夫です。

私がかみ砕いて解説しますね!

 

 

広告

自由度とは、自由に値を取れる数のこと。

まずは自由度の定義。

自由度とは、ある代表値や合計値があるときに、自由に値を取れる数。

これです。

これでイメージ出来て、完璧に理解出来たら、もう先を読まなくてもいいです!笑

でも、イメージ難しくないですか?

私には、さっぱり何のことやらって感じでした。。

 

χ二乗検定での自由度を例にしてみる

言葉や定義で分からないときは、例を考えるのが一番早いです。

ということで、χ二乗検定の例。

突然ですが問題です。

2×2分割表での自由度はいくつでしょうか?

あなたはわかりますか??

おそらく定義がわからなければ考えてもわからないかと思います。。

では正解。

正解は1です!

 

定義としては、(2-1)×(2-1)=1ですね。

2×2分割表なのでこの式ですが、例えば3×2分割表の場合だと、(3-1)×(2-1)=2になります。

そのため、一般化すると、m×n分割表の自由度は(m-1)×(n-1)となります。

一応、定義がわかったところで、なぜそのような式になるのかを考えていきます。

χ二乗検定のページで出てきたこの表。

 

治った

治らなかった

合計

薬剤群

13

7

20

コントロール群

5

15

20

合計

18

22

40

この表で自由度を考えてみます。

自由度とは、ある代表値や合計値があるときに、自由に値を取れる数でした。

つまり合計値だけがある場合を考えてみます。

 

こんな感じ。

4つのセルの数字がない分割表ですね。

 

治った

治らなかった

合計

薬剤群

 

 

20

コントロール群

 

 

20

合計

18

22

40

この時、4つのセルのうち、どこでもいいので自由に1つ数値を入れてみます。

例として、薬剤群の治った人のセルに15を入れてみます。

すると、こうなりますね。

 

治った

治らなかった

合計

薬剤群

15

 

20

コントロール群

 

 

20

合計

18

22

40

すると、残りのセルは3つ。

では次に、他の3つのセルのうち、どこでもいいので自由に1つ数値を入れてみます。

 

・・・これ以上自由に数字を入れることってできますか?

 

だって、薬剤群の治った人は15人です。

薬剤群は全部で20人です。

ということは、薬剤群で治らなかった人は、自動的に5人になりませんか?

他のセルも同様です。

治った人の合計は18人と決まっているので、コントロール群で治った人は、自動的に3人になります。

2×2分割表では、4つのセルのうち1つのセルの値が決まれば、残りの3つが自動的に決まってしまいます。

つまり、自由に値を決められるのは1つだけということです。

これが自由度の概念です。

T検定での例

T検定の自由度は「データの数-群の数」です。

これは結構有名ですね。

じゃあ、なんでこのような自由度の定義なのか。

考えてみましょう。

 

T検定は平均値を比較する検定手法ですね。

ということは、「自由度とは、ある代表値や合計値があるときに、自由に値を取れる数」の代表値は、平均値です。

平均値を出すとき、自由にとれるデータの数は?

例えば、10個のデータの平均値。

このとき、9個のデータが決まったら、残り一つは自動的に決まりませんか?

これが、T検定の自由度が「データの数-群の数」である理由です。

2群のT検定の場合、もちろん平均値は2つあることになりますね。

各群1つずつ平均値があって、それを比較するので。

なので、全データから2を引いたものが自由度になります。

まとめ

自由度とは、ある代表値や合計値があるときに、自由に値を取れる数。

m×n分割表の自由度は(m-1)×(n-1)となる。

T検定の自由度は、データの数-群の数となる。