JMPの使い方

JMPで多変量解析であるロジスティック回帰分析をする方法!結果の解釈も

ある現象が生じる確率をモデル化する方法として、ロジスティック回帰分析があります。

ロジスティック回帰は、応答変数(目的変数)が二値の場合に有効な解析ですよね。

この記事では統計解析ソフトJMPを使ったロジスティク回帰分析の実施法について解説していきます。

 

ロジスティク回帰分析とは?

ロジスティック回帰分析は様々な要因から、ある現象の発生確率を予測する多変量解析の手法の一つです。

 

特に、予測したい値、つまり応答変数(目的変数)が”離散的”であるときに用います。

離散的というのは、例えば、勝敗や、生死といった数値ではないものです。

また、身長や体重といった連続的なデータでも上位、中位、下位といったようにグループ分けすることで、離散的な値にすることができます。

 

ロジスティック回帰分析の特徴は、予測した確率が、0~1の範囲に収まることです。

 

一方で、多変量解析の手法の一つである重回帰分析分析では、

予測結果は0~1範囲を超えることがあります。

 

そのため、病気の発症確率や、生存確率などの解析に用いられます。

発生確率120%や-10%はあり得ませんよね。

 

それではJMPでロジスティック回帰分析を行っていきます。

 

JMP でロジスティック回帰解析

統計解析ソフトJMPには二種類のロジスティック回帰分析が実装されてています。

  • 名義ロジスティック回帰
  • 順序ロジスティク回帰

この二つは、応答変数(予測したいデータ)の種類によって異なります。

応答変数が例えば、成功と失敗や生と死といった”名義”であれば名義ロジスティック回帰を、

体重や身長の大小といったものであれば、順序ロジスティク回帰を用います。

 

JMPで名義ロジスティック回帰

データの読み込み

自分たちのデータを解析する場合は、

[ファイル] > [開く]から解析したデータを開いてください。

ExcelやCSV形式のデータを開くことができます。

 

この記事では、JMPにすでに用意されているサンプルデータを使います。

[ヘルプ] > [サンプルライブラリー]をクリックします。

すると、次のサンプルデータのディレクトリのウィンドウが出てきます。

今回はこの中の”Ingots.jmp”を使います。

このデータは”インゴットの製造に関する実験”に関するものです。

このデータで「状態」が名義的な応答変数に対応します。

「Ready」と「Not Ready」があり、

それぞれ、

「Ready」は「品質の良いインゴット」、

「Not Ready」は「品質の悪いインゴット」

といった意味です。

“品質の良いインゴットができるか”を、

インゴット作成の手順である、

「加熱時間」と「ソーキング時間 (熱処理時間)」から推測するのが

今回の名義ロジスティック解析の目的となります。

 

名義ロジスティック回帰解析の実行

[分析] > [モデルのあてはめ]を選択します。

すると、次のウィンドウが出現します。

[Y]に「状態」を選択します。

「Ready」と「Not Ready」は名義尺度のため、

左上のところが、自動で”名義ロジスティック”となります。

また、イベント示す水準は「Ready」と「Not Ready」から選択することができあます。

今回は「品質の良いインゴット」ができるかを調べるので、「Ready」を選択します。

 

[モデル効果の構成]には「加熱時間」と「ソーキング時間」を選択します。

[度数]には「度数」を選びましょう。

 

選択ができたら[実行]をクリックします。

 

結果の見方

計算が終われば、次の結果が出力されます。

モデル全体の検定から、

名義ロジスティック回帰解析でできたモデルの妥当性がわかります。

ここのp値が0.003と小さいため、今回のモデルは有意であるということができます。

 

各パラメータが「品質の良いインゴット」の成否に寄与しているかは、

パラメータ推定値を見ればわかります。

ソーキング時間はp値が0.8639であるため、「品質の良いインゴット」の成否には重要でないという結果になりました。

 

JMPで順序ロジスティック回帰解析

データの読み込み

順序ロジスティック回帰解析でも、JMPにすでに用意されているサンプルデータを使います。

[ヘルプ] > [サンプルライブラリー]をクリックします。

すると、次のサンプルデータのディレクトリのウィンドウが出てきます。

今回はこの中の”Cheese.jmp”を使います。

このデータは”チーズの添加物とその味”にを調べています。

「チーズ」の項目は、A〜Dまでの加えた添加物を表しています。

「評価」は試食した人が1-9の9段階評価で味を評価したものです。

 

今回は”チーズの添加物とその味の評価”のデータを用いて

添加物が味の評価に与える影響を予測するモデルを作っていきます。

 

順序ロジスティック回帰解析の実行

[分析] > [モデルのあてはめ]を選択します。

すると、次のウィンドウが出現します。

[Y]に「評価」を選択します。

1~9の9段階評価は順序尺度のため、

左上のところが、自動で”順序ロジスティック”となります。

 

[モデル効果の構成]には「チーズ」を選択します。

[度数]には「度数」を選びましょう。

 

選択ができたら[実行]をクリックします。

 

結果の見方

計算が終われば、次の結果が出力されます。

モデル全体の検定から、

順序ロジスティック回帰解析でできたモデルの妥当性がわかります。

ここのp値が0.0001と小さいため、添加物の評価への影響は有意にあるということができます。

 

各添加物が「評価」のに寄与しているかは、

パラメータ推定値を見ればわかります。

ここで、推定値が最小のものが、もっとも評価の高いチーズを意味します。

チーズDはここには出ていませんがが

(チーズ[A]+チーズ[B]+チーズ[C]) x (-1)= -2.4750

です。

結果からは、Dの添加物がもっとも人気で、Bの添加物がもっと不人気ということになります。

 

まとめ

  • 統計解析ソフトJMPには二種類のロジスティック回帰分析が実装されいる。
  • 応答変数が名義なのは名義ロジスティック回帰
  • 応答変数が順序なのは順序ロジスティク回帰
  • [分析] > [モデルのあてはめ]から行う

 

論文化に必要な統計に絞った地図あります

 

  • パソコンに向かってもなぜか筆が進まない…
  • 学会発表は結構たくさんしているのに、なぜ論文が出ないのだろう…
  • こんなに忙しいのに、いつ論文を書いたらいいのか…
  • 一度は書いたはずの論文がお蔵入りに…どうすればいいの…
  • データはあるのになぜ論文化まで持っていけないんだろう…
  • このデータ、どうやって解析すればいいんだろう…

 

その悩みこの無料メルマガで全て解決するかもしれません

 

↓今すぐ無料で論文化までの最短距離を歩く↓

↑無料で論文化に必要な統計を最短で学ぶ↑