MENU

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

線形判別分析と数量化 II 類の違い

線形判別分析とは?

数量化II類とは?

違いは何か?

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

目次

線形判別分析とは?

線形判別分析とは、いくつかの変数で、群分けできる「判別関数」という係数の組み合わせを求めることである。

いくつかの変数と最適な係数の掛け合わせ+足し合わせで、合成変数を作ることになる。

合成変数を $ f $、係数を $ a $、変数を $ X $ とすると、以下のように書ける。

\begin{equation} f = a_1 X_1 + a_2 X_2 + \dots + a_n X_n \end{equation}

その合成変数でうまく群にわかれるように係数を決めていく。

判別関数に含まれる変数の情報があれば、群分けが予測できるということである。

例えば、サイズ、色、形などの情報で、商品が売れる売れないが予測出来たり、5教科のテストの点数で、将来の受験がうまくいくいかないが予測出来たりする。

判別する群の数は2つだけでなく3つ以上でもよい。

また、判別関数の係数は、一組だけでなく、2番目にうまく判別できる係数の組なども推測できる。

その点は、二値や三値以上の目的変数を予測する、二項ロジスティックや多項ロジスティックと異なる点である。

どちらかと言うと、合成変数を作成する点や、係数の組がいくつも計算できる点からすると、主成分分析に近い。

合成変数や係数のプロットが可能で、可視化できるところもロジスティック回帰モデルよりも楽しい分析方法である。

ちなみに、線形判別分析では、各群の分散共分散行列が等しい(等分散性)必要がある。

その前提の下で、相関比が最大になる係数を求める方法が、相関比を用いた係数の求め方である。

相関比は、群間変動と群内変動の比で、カテゴリカルデータと連続データの相関とも呼ばれる。

群間の変動ができるだけ大きく、群内の変動ができるだけ小さいときに、相関比は最大となり、その時の係数を求める方法になる。

一方で、二次の判別関数を用いると、その等分散性が不要になる。

マハラノビスの距離に基づく判別関数を求める方法は、等分散性が不要な方法である。

詳しくはこちらを参照。

マハラノビスの距離に基づく判別係数の求め方

数量化II類とは?

線形判別分析と似た分析として、数量化II類がある。

数量化II類は、上記の変数 $ X $ がカテゴリカルデータで、ダミー変数に変換して判別分析を行う方法である。

ダミー変数にすることにより、本来は連続データしか扱えない統計解析手法でも、カテゴリカルデータが扱えるようになる。

ダミー変数の係数が求まることによって、カテゴリカルデータが数量に変換されるということで、数量化と呼ばれる。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

まとめ

群に分けるための多変量データの係数を求める線形判別分析について、定性的な説明をしてみた。

多変量データは、カテゴリカルデータでもよく、その時は数量化II類と呼ばれる方法になる。

ロジスティック回帰モデルでも分析できそうな方法であるが、判別のための係数が複数セット得られる点が、ロジスティック回帰モデルとは異なる点だ。

主成分分析のように、もっとも重要な係数のセットと2番目に重要な係数のセットのグラフ化など可視化に強い。

参考サイト

判別分析

相関比を最大にすることによる判別係数の求め方

マハラノビスの距離に基づく判別係数の求め方

Rと判別分析

判別分析 – Wikipedia

参考動画

– YouTube

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

コメント

コメントする

目次