教科書的には何を計算するかは決まっているが、論文にどの数値を掲載するかは決まっていない。
そういうときは、実例をもとに、まねするのが良いが、最低限の目安を示す。
回帰分析の結果の書き方の基本
一番大事な要素は、点推定値と95%信頼区間である。
p値は、観察研究の場合、おまけであるので、95 %信頼区間があれば、書かなくてもよいのだが、これも通常書かれているので、書いておいたほうが無難である。
p 値が書いてあれば、検定統計量(t値とか、F値とか、カイ二乗値とか)は本来不要である。
p 値、検定方法、自由度がわかれば、検定統計量は逆算できるからである。
昔のように、α 水準別の検定統計表の数値と照らし合わせて、p 値が、0.05 未満とか、0.01 未満とかそういう判定はせずに、直接 p 値を計算するようになっているので、その点でも検定統計量の数値自体を報告する意義は薄いと思う。
また、検定統計量は、メタアナリシスなどに使用するわけではないため、個々の論文で報告しておく必要性は低い。
だが、検定統計量が掲載されている論文は多い。
それにならって検定統計量を書き入れてもよいだろう。
研究ごとに示すべき数値を挙げる。
- 重回帰分析:推定値(非標準化、標準化)、p値、自由度調整済み決定係数
- ロジスティック回帰分析:オッズ比、オッズ比の95%信頼区間
- 線形混合モデル:推定値、p値
- 一般化線形混合モデル(logitの場合):オッズ比、オッズ比の95%信頼区間
あとは同じ分野の先行研究のまねをして、最低限必要と思う計算値を足す。
重回帰分析
よく記載されている数値は、
偏回帰係数、標準誤差、標準化偏回帰係数、t値、p値
というところである。
偏回帰係数をベータと記載したり、標準化偏回帰係数をベータと記載したりしているので、Statistical MethodのセクションとTableの脚注をよく読んで、確認する必要がある。
ただし、標準化偏回帰係数を掲示している研究は多くない印象。
The Journal of Strength & Conditioning Research
共分散分析(Analysis of covariance)という記述になると、最小二乗平均(Least square mean)が示される方向性。
重回帰分析:日本語論文の例
日本語の論文は例えばこちら。
共働きの父親、共働きの母親それぞれの成人愛着スタイルがコペアレンティングに及ぼす影響
母親による感情の社会化と幼児の心理的適応─他者のネガティブ感情への対処に着目して─
3歳未満の子どもを養育する父親におけるコペアレンティングの影響要因に関する横断研究
いずれも、階層的重回帰分析を行っている。
標準化偏回帰係数、p 値、t 値、VIF という組み合わせの論文もある
女性看護師が受ける心理的暴力・嫌がらせやサイバーブリングと抑うつや離職意向との関連
二元配置分散分析(二要因分散分析)
二要因がともに独立のいわゆる二元配置分散分析の論文は、探してもなかなか見つからない
たいていは、二元配置分散分析を対応ありデータ、すなわち、反復測定データに適用している
二要因のうち一要因は対応あり(反復測定分散分析)
主効果及び交互作用の検定の有意確率 P 値とグラフを表示している例
うつむき姿勢保持に対する温罨法およびマッサージによる苦痛緩和効果
新型コロナウイルス感染症拡大下における大学生のメンタルヘルスと社会的スキルに関する調査研究:
F 値、ES(Effect size)、P 値(*で表示)及びグラフを表示している例
高等専門学校生の体力における発達傾向の差異−1990年および2000年に入学した男子学生を対象として−
自由度、F 値、P 値を示している例(グラフなし)
知的障害者入所施設からの地域生活移行が移行者に及ぼす影響に関する研究
ロジスティック回帰分析
掲載されている数値セットごとに実例を挙げる。
偏回帰係数、p値、オッズ比、オッズ比の95%信頼区間。
偏回帰係数、SE、オッズ比、95% 信頼区間、P 値
偏回帰係数、標準偏差、Wald検定統計量、自由度、p値、オッズ比、オッズ比の95%信頼区間というフルパッケージの論文もある。
シンプルにオッズ比、オッズ比の95%信頼区間、p値の論文。
もっとシンプルにオッズ比とオッズ比の95%信頼区間といわゆる星(*)
一番シンプルに、P 値に触れず、オッズ比と 95 %信頼区間のみの論文
ロジスティック解析:日本語論文の例
オッズ比、95 % 信頼区間、P 値の表示
新型コロナウイルス感染症流行下におけるバス事業労働者のメンタルヘルスと新型コロナウイルス恐怖および雇用の不安定性との関連
オッズ比、95 % 信頼区間、P<0.05 を示すアスタリスク
小規模事業場における労働者の「治療と仕事の両立支援」の申出意図の促進要因:協働的風土の観点から
修正ポアソン回帰分析
相対リスク(Relative Risk)と絶対リスク差(Absolute Risk Difference)の点推定値と 95 % 信頼区間を表示している論文例
相対リスクと 95 %信頼区間のみの論文
ポアソン回帰分析
偏回帰係数、SE、真数の偏回帰係数、p値、95%信頼区間を挙げている論文がある。
偏回帰係数、SE、95%信頼区間、検定統計量、p値を挙げている論文もある。
負の二項回帰分析
偏回帰係数、SE、検定統計量、p値が挙げられている。
ポアソン回帰分析を同時に行っていて、結果の書き方は同じである。
Analysis of highway crash data by Negative Binomial and Poisson regression models
線形混合モデル
偏回帰係数、標準誤差、95%信頼区間、p値を示している論文。
偏回帰係数、標準誤差、t値、p値のみを提示している論文。
調整平均差の点推定値、95 % 信頼区間、P 値、及びグラフという論文もある
調整平均差の点推定値、95 %信頼区間、P 値のみというシンプルな論文
数値をこまごまと書かずに、グラフ表示をメインにしている論文が多い印象である。
日本語の文献の例で、グラフ表示があり、数値はF値とp値の掲載。
中高年を対象とした運動介入プログラムによる健康増進効果:平成 16 年度札幌市国保ヘルスアップモデル事業の結果から
こちらも日本語の文献の例で、推定平均、標準誤差、F値とp値の表示。
こちらは、平均値、標準誤差、F 値、P 値、効果量 d、d の 95 % 信頼区間という組み合わせ
一般化線形混合モデル
正規分布連続データ
偏回帰係数、標準誤差、t値、p値という例がある。
Factors That Influence the Rating of Perceived Exertion After Endurance Training
動物実験の結果に適用した例
Figure 6 が結果と思われる
図のみであり、Table は提示されていない
ガンマ分布連続データ
二値カテゴリカルデータ
順序カテゴリカルデータ
オッズ比と 95 %信頼区間
一般化推定方程式
正規分布連続データ
偏回帰係数、標準誤差、及び P 値
中学生における近隣の地域環境の質,個人レベルの social capital と抑うつ症状との関連
二値カテゴリカルデータ
試験デザイン論文
偏回帰係数(対数オッズ比)、標準誤差、検定統計量、P 値、オッズ比、95%信頼区間
人間ドック・定期健診受診者における糖尿病新発症と糖尿病寛解に関連する因子の調査 -抗高脂血症内服薬治療は糖尿病の寛解に影響するか?-
順序カテゴリカルデータ
オッズ比、95%信頼区間、グラフ
特定の統計解析手法を使っている論文を探す方法
まず、統計解析手法名を検索エンジンや Perplexity AI で検索する
手法を使用している論文がすぐに見つかれば OK
統計解析手法の論文が検索されてきた場合、Pubmed にあるような「Cited by(引用されている論文リスト)」セクションを探す
Cited by セクションの論文にあたると、探していた統計解析手法を使っている論文であることが多い
その論文の記載を参考にできる
日本語の論文を検索する場合は、J-Stage の検索窓に、統計解析手法を入力して検索すると、その手法を使った論文が簡単に見つかる
全文が PDF で取得でき、全文検索可能な論文が多いからではなかろうか
J-Stage はおすすめ
まとめ
重回帰分析、ロジスティック回帰分析、線形混合モデル、一般化線形混合モデルのそれぞれの結果の書き方について、どの数値を論文に掲載すべきかという観点で、例示してみた。
絶対的なルールはなく、同じ分野の先行研究の真似をするのが一番適切である。
おすすめ書籍(日本語での書き方例が載っている)
SPSSで学ぶ医療系多変量データ解析 第2版
レポート・論文への記載というセクションがある親切な書籍。
コメント
コメント一覧 (2件)
[…] 重回帰分析の結果の書き方 ― 論文にはどの数値を書いたらよいか […]
[…] 重回帰分析の結果の書き方 ― 論文にはどの数値を書いたらよいか […]