標準化偏回帰係数(ひょうじゅんかへんかいきけいすう)とは何か?
一言で言えば、単位が異なる説明変数の、目的変数に対する影響力を比較したいときに、便利な数値と言える
順を追って、式なしでイメージだけでわかりやすく解説
標準化偏回帰係数の前に回帰係数とは何か?
標準化偏回帰係数の前に、まず、回帰係数とは何か?
回帰係数は、説明変数が 1 大きくなった時に、目的変数の推定値が、いくつ大きくなるか、または マイナスの場合は小さくなるかを表す数値である
回帰分析を行うと、計算上求められる
単に係数と言ったり、推定値とか、パラメータ推定値と言うこともある
例えば、体重を説明変数として、血圧を目的変数とすると、回帰分析の結果、体重の回帰係数が求まる
回帰係数は、体重 1 kg 増加するごとに、血圧がいくつ上昇するかの推定値ということになる
標準化偏回帰係数の前に偏回帰係数とは何か?
回帰係数はわかったとして、標準化偏回帰係数の前に、偏回帰係数とは何か?
偏回帰係数は、同時に投入した別の説明変数の影響を除いた、回帰係数という意味である
重回帰分析の計算の結果、求まるのが偏回帰係数である
偏が省略されて回帰係数と書いてあったり、単に係数と書いてあったり、推定値と書いてあったり、パラメータ推定値と書いてあったり、B(ビー)と書いてあったり、β(ベータ)と書いてあったり、それはそれはさまざまなので、どのように書いてあると偏回帰係数と言うことは難しい
勘を働かせて、どれが偏回帰係数なのかを見極める必要がある
例えば、体重を説明変数として、年齢をもう一つの説明変数とする
目的変数を血圧として、体重と年齢で予測する重回帰分析を行うとする
計算の結果、体重と年齢の偏回帰係数が求まる
体重の偏回帰係数は、年齢の影響を除いた体重 1 kg 上昇あたりの血圧上昇の推定値という意味である
年齢の偏回帰係数は、体重の影響を除いた年齢 1 歳 上昇あたりの血圧上昇の推定値という意味である
標準化偏回帰係数とは?
では、回帰係数、偏回帰係数がわかったところで、標準化偏回帰係数とは何か?
標準化偏回帰係数とは、説明変数と目的変数をそれぞれ標準化したデータを用いて行った重回帰分析の結果得られた偏回帰係数のことである
では、標準化とは何か?
標準化とは、平均 0 、標準偏差 1 に計算上修正することを言う
具体的には、例えば、体重なら、サンプル一人ひとりの体重から、サンプルの平均値を引き、サンプルの標準偏差で割ることを標準化と言う
こうすると、平均 0、標準偏差 1 にそろったデータに変換できる
例えば、目的変数の血圧も、説明変数の体重も、年齢も、それぞれ標準化して重回帰分析を行い、偏回帰係数を求めると、標準化偏回帰係数が求まる
標準化とはどんな意味なのか?
標準化すると、血圧も、体重も、年齢も、1 が同じ意味を持つようになる
それまでは、血圧は 1 mmHg、体重は 1 kg、年齢は 1 歳というふうに単位が異なっていた
しかし、標準化することで、単位がなくなり、1 は、血圧でも体重でも年齢でも、すべて同じで単位はなく、標準化したデータの標準偏差(つまり 1)という意味になる
このように計算した標準化偏回帰係数は、どんな意味を持つか?
単位がなくなったデータから計算される標準化偏回帰係数の利点は、数字の大きさを比較することができるようになる点である
データが同じ基準にそろっているので、その結果出てきた数値は、同じ土俵であり大小を比較できる
標準化偏回帰係数の絶対値が大きいほど、目的変数への影響力が大きいと考えてよい
+であれば、目的変数の推定値が大きくなる方向
- であれば、目的変数の推定値が小さくなる方向
へそれぞれ影響力を持つ
絶対値が大きいほど、影響力が大きいと考えてよい
例えば、体重に比べて、年齢のほうが標準化偏回帰係数が大きければ、「体重と比べて、年齢のほうが血圧に対する影響力が強いと考えられた」という解釈になる
まとめ
標準化偏回帰係数とは何かについて、順を追って説明した
単位が異なる説明変数の、目的変数に対する影響力を比較したいときに、便利な数値と言える
何らか参考になれば
参考サイト
標準化偏回帰係数とは何? わかりやすく解説 Weblio辞書
標準偏回帰係数 standardized partial regression coefficient – 一般社団法人 日本理学療法学会連合
コメント