標準偏回帰係数(標準化回帰係数)とは?Rでの実施方法も解説!

この記事では「標準偏回帰係数(標準化回帰係数)とは?Rでの実施方法も解説!」ということでお伝えします。

  • そもそも標準化とは?
  • 回帰分析で偏回帰係数の弱点と標準変回帰係数を求める目的
  • Rで標準変回帰係数を求める

ということを理解できるようになります!!

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

そもそも標準化とは?

標準化回帰係数(標準偏回帰係数)を理解するために、まずは「標準化」ということをまずは理解しましょう。

「標準化」が出てくる場面としては、標準正規分布を考える時です。

標準正規分布とは、平均0、標準偏差1の正規分布のこと。

統計で言う「標準化」とは、上記のような平均0、標準偏差1の正規分布に変換することを言います

具体的には、下記のような変換を実施します。

標準化データ

標準化をするメリットは「単位がなくなるので異なるデータでも比較が可能になる」という点。

例えば、体重と身長のデータを比較できたり、日本円とアメリカドルのデータを比較できたりすることができます。

回帰分析での(標準化されていない)偏回帰係数の弱点

標準化がわかったところで、ではそもそも標準化されていない偏回帰係数にはどんな弱点があるのでしょうか?

重回帰分析ロジスティック回帰分析Cox比例ハザードモデルなど、多変量解析を実施すれば必ず出てくる偏回帰係数。

偏回帰係数とは、xが1単位(例えば体重なら1kgあたり)変化するごとのyの変化度合いを示しています。

弱点は、説明変数の単位が異なると異なる値を示すため、 目的変数の影響度の大きさを説明変数同士で比較したい場合には使いにくい、ということ。

そのため、説明変数の影響度の大きさを比較するために、標準偏回帰係数を求めることがあるんです。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

標準偏回帰係数を求める目的

標準化に関する理解と、標準化していない偏回帰係数の弱点を整理できると、標準偏回帰係数を求める目的が見えてきました。

標準偏回帰係数を求める目的は、ただ一つです。

説明変数間の目的変数に対する影響度の大きさを比較するため

上記が、標準変回帰係数を求める目的です。

Rで標準偏回帰係数を求める方法

標準偏回帰係数に関して整理できたので、実際にRで標準変回帰係数を求めてみましょう。

ゴール設定は、SAS社のこちらのページにある下記の結果を再現することです。(ただし、切片は再現できない。)

このプログラムに用いるデータはこちらからダウンロードできますので、ぜひ実際にやってみてください。

>>プログラムに用いるデータのダウンロード

 

実際のRプログラム

では、実際のRプログラムです。すでにデータが「cars_sas」という名前でRの中にインポートしている前提でのプログラムであることをご注意ください。

上記のプログラムを実行すると、下記のような結果が出力されます。

こちらをSASの結果と再度見比べてみます。(e-01は10のマイナス1乗の意味です。)

e-01は10のマイナス1乗の意味なので、再現ができました。

 

標準偏回帰係数を求める際の議論

標準変回帰係数を求める際に議論となっていることがあります。

それは、「因子型のデータ(カテゴリカルデータ)を標準化する必要はあるのか?」ということ。

因子型変数は通常、ダミー変数(0と1のコーディング)に変換されて回帰分析に使用されます。

そして、ダミー変数は既に0と1の値を持っているため、さらに標準化する意味がないのでは、という議論です。

例えば、性別(男性=0、女性=1)の係数が2.5の場合、 他の変数が一定の条件下で、女性は男性よりも平均して 2.5単位高い値を持つことを意味しており、因子型変数に関しては、上記の解釈が全て。

そのため、わざわざ標準化する意味がなく、標準化すると解釈が難しくなる可能性があります。

 

ただ、今回の記事ではSASでの数値を再現するためにダミー変数も標準化しました。

臨床研究では説明変数が1単位変化した場合の目的変数の変化を解釈することに興味があることが多いため、 標準化しない偏回帰係数を求めることがほとんどかなと思います。

まとめ

いかがでしたか?

この記事では「標準偏回帰係数(標準化回帰係数)とは?Rでの実施方法も解説!」ということでお伝えしました。

  • そもそも標準化とは?
  • 回帰分析で偏回帰係数の弱点と標準変回帰係数を求める目的
  • Rで標準変回帰係数を求める

ということを理解できたのなら幸いです!

この記事の内容は、動画でもお伝えしていますので併せてご確認くださいませ。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメントする

目次