-
数量化理論
線形判別分析と数量化 II 類の違い
線形判別分析とは? 数量化II類とは? 違いは何か? 線形判別分析とは? 線形判別分析とは、いくつかの変数で、群分けできる「判別関数」という係数の組み合わせを求めることである。 いくつかの変数と最適な係数の掛け合わせ+足し合わせで、合成変数を作... -
共分散分析
EZR と SPSS で前後 2 時点の対応のあるデータを共分散分析で群間比較する方法
前後2時点の対応のあるデータを群間比較するときは、共分散分析を使う EZR と SPSS の方法を解説 対応のあるデータの群間比較の考え方 対応のあるデータの群間比較の際に、考え方が2つある。 一つは、後のデータを目的変数に、群別変数を着目する説明変数... -
回帰分析・線形回帰・重回帰
SPSS で交互作用項を作って交互作用項を含む重回帰分析を行う方法
重回帰分析に交互作用を含んだ解析をSPSSで計算する方法。 SPSSの重回帰分析では、交互作用項を自動で作ってくれない。 どのように作って、どのように解析すればよいか? SPSSで交互作用項の作り方 重回帰モデル内で交互作用の検討をするためには、交互作... -
相関係数
R でケンドールの順位相関係数を計算する方法
ケンドールの順位相関係数はどのように計算するか紹介する ケンドールの順位相関係数 ケンドール(Kendall)の順位相関係数 $ \tau $ は、順位を使わない相関係数である。 何を使うかというと、値の大小を使う。 変数Xと変数Yの相関を計算する際に、2つのX... -
カプランマイヤー曲線
R と EZR で IPTW カプランマイヤー曲線を書く方法
IPTW カプランマイヤー曲線の書き方。 RのパッケージとEZRを使うと書ける。 IPTWとは? IPTW とは、Inverse Probability of Treatment Weights の頭文字語。 逆確率重み付けの意味。 傾向スコア (Propensity Score) を使った、交絡要因調整の一種。 処方さ... -
グラフ
EZR でグラフの余白を調整する方法
EZRでグラフが出力されたときに、余白が狭くて軸の文字が見えないことがある。 余白を調整するにはどうしたらよいか? EZRでグラフの余白調整が必要な例 もっとも典型的なグラフは、分散分析でTukeyのオプションを入れたときに出力されるグラフである。 左... -
フォレストプロット
サブグループ解析の結果をフォレストプロットで描く方法
サブグループ解析の結果をフォレストプロットで書く方法。 ロジスティック回帰の場合で、EZR で行う方法。 Version 1.62(2023 年 11 月 1 日公開)から、EZR 本体に組み込まれたので、以下の方法を使う必要なし 具体的な方法はこちらの動画参照。 フォレ... -
回帰分析・線形回帰・重回帰
重回帰分析の計算方法
重回帰分析は偏回帰係数を求めて予測式(回帰式)を作り、標準化偏回帰係数の計算、回帰式の有意性の分散分析、決定係数の算出、偏回帰係数の検定、など行うが、実際どんな計算をしているのか? 実際どんな計算をしているかわかると、偏回帰係数や標準化偏... -
ノンパラメトリック検定
ノンパラメトリック多重比較法の Dunn 検定の簡単な解説とサンプル数の偏り・タイデータについて
Dunn検定と言えば、順位和を使った検定が有名である。 これはSPSSでクラスカルウォリス検定をしたあとのPost-hoc検定として有名。 どんな検定なのか? Dunn検定の明確化 Olive Jean Dunn先生は、1961年と1964年に二つのDunn検定を発表している。 1961年のD... -
基礎知識
クラスカルウォリス検定の各群サンプル数条件とタイデータの影響
クラスカルウォリス検定を、原著に立ち返って、わかりやすく解説。 各群のサンプル数が偏ってはいけないなどの条件があるのかどうか、また、タイデータ(同順位データ)の影響について。 クラスカルウォリス検定とは? クラスカルウォリス検定とは、3群以... -
基礎知識
R と EZR で学ぶ主成分分析の計算方法
主成分分析は、多変量情報の縮約と言われるが、実際にはどんな計算をしているのか? 数学的に少し詳しくわかりたい人向け。 主成分分析の計算上の目標は合成変数の作成と分散の最大化 主成分分析の数学的な計算の目的は、合成変数の作成と、その合成変数の... -
サンプルサイズ計算
R で共分散構造分析に必要なサンプル数を計算する方法
「共分散構造分析(SEM)は、なんだか難しそう…」と感じていないだろうか。そして、「どれくらいのデータがあれば、この分析ができるのだろうか?」と悩んだことはないだろうか。論文や研究でSEMを使いたいけれど、統計や数学は苦手だという方、安心してほ... -
正規性
回帰分析における 7 つの仮定
目的変数が正規分布している必要はない。 説明変数も正規分布している必要はない。 前提知識 実際に測定された目的変数を実測値と言う。 回帰式で計算された目的変数を予測値と言う。 実測値と予測値の差を残差と言う。 正式には母集団の誤差項の話になる... -
カーネル密度推定
カーネル密度推定の簡単な説明とバンド幅の設定方法
カーネル密度推定とはどんな推定で、どんな時に使われるのか? バンド幅の決め方も紹介 カーネル密度推定とは何か? とても分かりやすい記事を見つけたので、そのまま引用する。 さて、カーネル密度推定法を大雑把に言うと、「確率密度が全然わからない確... -
線形混合モデル
混合モデルにおけるランダム切片の話
繰り返し計測された連続データを適切に扱うために必要な線形混合モデル。 ランダム切片モデルが一番単純で有名だが、その切片はどんなふうになっているか。 通常の線形モデルの切片はどんな計算になっているか? 例えば、連続データ CDratio1 を 3 群のFCZ... -
ヨンキー検定
EZR で Jonckheere-Terpstra 検定を行う方法
Jonckheere-Terpstra 検定(ヨンクヒール タプストラ検定、ヨンキー検定)とは? Jonckheere-Terpstra検定とは? 3群以上の群で、単調に増加するか、単調に減少するかなどの傾向を検定するノンパラメトリックな検定法。 Jonckheere-Terpstra 検定は、デー... -
マンホイットニーのU検定
マンホイットニーの U 検定に最低限必要なサンプル数はいくつか
マンホイットニーのU検定を行う際に最低限何例あればよいか? マンホイットニーのU検定はどんな計算をしているか? マンホイットニーのU検定はそもそもどんな計算をしているか、という点から、各群最低何例必要かを考えたい。 数学的には同値になる、方法... -
相関係数
R で相関係数の差の検定を行う方法
相関係数の比較はどうやるか? 相関係数の差の検定とは? 相関係数の比較 相関係数の差の検定 (この記事で言う相関係数は、すべてPearsonの積率相関係数を指している) 相関係数の差の検定は、以下の検定統計量 T を計算し、標準正規分布で有意確率を求... -
基礎知識
EZR の集計結果・解析結果をエクセルに簡単きれいに貼り付ける方法
EZRの出力をExcelにきれいに貼り付ける方法。 標準の機能を使う方法と、テキストファイルウィザードを使う方法を紹介する。 ベースラインの患者背景の表 「グラフと表」メニュー中の「サンプルの背景データのサマリー表の出力」を使うと、ベースラインの患... -
回帰分析・線形回帰・重回帰
SPSS と GPower で重回帰分析に必要なサンプル数を計算する方法
重回帰分析を実施するのにサンプル数はどのくらい必要か? ここでいうサンプル数とは、サンプルサイズのこと。 重回帰分析のサンプルサイズはどのように計算するのか? 重回帰分析の効果量とは何か? 重回帰分析のサンプル数計算に必要な値は? サンプル数... -
層別解析
連続データの層別解析結果を統合する方法
連続データの代表的な要約値、平均値と標準偏差を統合するにはどうやったらよいか? 連続データを層別で要約値を求めた後に統合する方法。 連続データの層別解析の統合とは? 目的変数としての連続データに対して、交絡を調整しながら分析するには、共分散... -
層別解析
SPSS と EZR で層別ログランク検定を行う方法
層別ログランク検定を SPSS と EZR で行う方法を解説する 層別ログランク検定の使い分け 生存時間データで交絡を調整したいということなら、コックス比例ハザードモデルを使えばよいのだが、なんらかの理由で層別解析&統合をしたい場合、どうしたらよいか... -
層別解析
SPSS でクロス集計を層別で行って統合する方法
マンテル・ヘンツェル検定は、層別の分割表を統合する方法だ。 SPSSではどのように行うか。 SPSSでマンテル・ヘンツェル検定を行う方法 分析→記述統計→クロス集計表 と進む。 行、列、層にそれぞれ、説明変数、目的変数、層別変数を投入する。 説明変数と... -
多重共線性
SPSS の二項ロジスティック回帰で VIF を計算する方法
SPSSで共線性の診断としてVIFを計算する方法。 二項ロジスティック回帰分析の場合。 SPSSで共線性の診断のためVIFを計算する方法 ロジスティック回帰分析の場合 SPSSのロジスティック回帰分析を行うメニュー(分析→回帰→二項ロジスティック)では、VIFを計... -
割合の差の検定
EZR SPSS G*Power でカイ二乗検定に必要なサンプル数を計算する方法
カイ二乗検定に必要なサンプル数計算の解説 カイ2乗検定のサンプルサイズ計算を EZR で行うには? カイ2乗検定のサンプルサイズと言っても、準備するのは2群の割合だ。 2x2分割表から2群のそれぞれの割合を計算しておく。 あとは、2群を1:1にす... -
多項ロジスティック回帰
SPSS で多項ロジスティック回帰分析を行う方法
目的変数が3値以上のカテゴリカルデータの場合は、多項ロジスティック回帰分析を実施する。 多項ロジスティック回帰分析をわかりやすく解説。 SPSSで実施する方法と結果の見方。 多項ロジスティック回帰分析とは? 3値以上のカテゴリカルデータが目的変数... -
正規性
EZR の散布図行列で表示される曲線グラフの意義
EZRの散布図行列において各変数の文字が表示されているスムーズなグラフの解説。 EZR の散布図行列で表示される曲線グラフ 以下の赤矢印で示した曲線グラフのことを言っている。 この曲線は、何を表しているのだろうか? EZRの散布図行列で表示される曲線... -
決定係数
決定係数とモデルの有意性の分散分析 ― 重回帰モデルの評価としての意義
重回帰モデルの評価指標の決定係数とモデルの有意性の分散分析の検定はどのように使い分ければよいのか? 決定係数とは? 決定係数とは、推定された重回帰モデルが実際のデータにどの程度当てはまっているかを表す指標である。 0から1の範囲の数値をとり... -
ロジスティック回帰
Analysis of Deviance の意味と EZR SPSS JMP での計算結果
ロジスティック回帰の結果で出力される、Analysis of Deviance(EZR)、モデル係数のオムニバス検定(SPSS)、モデル全体の検定(JMP)とは何か? 一言で言えば、モデルの統計学的有意性の検定である。 ロジスティック回帰におけるDevianceとは何か? Devi... -
一般化線形混合モデル
EZR で対応のある 2 値カテゴリカルデータを群間比較する方法
対応のある2値データを群間比較したいときどうすればよいのか? 対応のある2値データの群間比較とはどういう状況か? 対応のある2値データの群間比較とはどういう状況だろうか。 それは介入前後で、Yes/Noとか、あり・なしとか、そういう2値のデータが... -
基礎知識
交互作用は文脈によって意味が異なるので意味合いを確認したほうが良い
どうやら「交互作用」と言ったときに、何を指すかは、人それぞれのようだ。 交互作用という言葉の帰納的解釈 ウェブサイトを漁ってみて、以下の暫定的な結論にたどり着いた。 大きくわければ、交互作用は2つの意味で使われている。 効果修飾の意味で使っ... -
スプライン曲線
EZR で B スプライン曲線を描く方法
曲線のあてはめの一つ、B スプライン曲線を描く方法。 EZR のメニューを借りて実施する。 B スプライン曲線を描く方法の概要 概要は以下の通り。 EZRの標準メニューからモデルのあてはめでbs()関数を使ってモデルを求める。 モデルを当てはめたXとYを使っ... -
対比
直交対比の簡単な説明
直交対比とは何か? 直交対比の直交とは? 直交とは何か? 英語では、orthogonal と言う。 Orthogonal とは何か? https://www.collinsdictionary.com/dictionary/english/orthogonal Web辞書で確認すると、直角とか直交という意味が1番基本となる意味であ... -
サンプルサイズ計算
必要なサンプル数計算のための 2 群共通の標準偏差の求め方
2群の平均値比較、いわゆるt検定のためのサンプルサイズ計算の際の2群共通の標準偏差の求め方。 2群共通の標準偏差とは、サンプルサイズで重み付けした、標準偏差の重み付け平均のことである。 サンプルサイズ計算のための 2 群共通の標準偏差の計算式 ... -
一元配置分散分析
SPSS で一元配置分散分析に必要なサンプル数を計算する方法
分散分析のサンプルサイズ計算はあまり知られていないが、多くの人に探されている方法である。 SPSSで計算する方法を紹介する。 分散分析のサンプルサイズ計算はSPSSのどのメニューから実行するか? メニューは、分析→検定力分析→平均→一元配置分散分析、... -
反復測定分散分析
EZR と R の ggplot でエラーバー付きの平均値折れ線グラフを書く方法
ggplot2 というグラフをきれいに描画するパッケージを使って、エラーバー付きの平均値の折れ線グラフを描く方法を紹介する。 反復測定したエンドポイントの平均値と、SDとか95%信頼区間とかを描画する方法。 ggplot でエラーバー付き折れ線グラフを書く土... -
基礎知識
構造方程式モデリングを ざっくり わかりやすく 解説
構造方程式モデリング(SEM)とは? ざっくり、わかりやすく解説 構造方程式モデリング SEMとは? 構造方程式モデリングは、英語の略語で SEMと呼ばれ、Structural Equation Modeling の略である。 これは複数の変数を用いて、理屈で考えた、変数間の相関... -
相関比
SPSS の出力で学ぶ相関比
順序がないカテゴリカルデータと連続データの「相関」が相関比である 2 群と連続データの相関比 相関比とは、2値のカテゴリカルデータを0と1のダミー変数にして、連続データとPearsonの積率相関係数を計算する。 計算結果の絶対値が相関比である。 カテ... -
順序ロジスティック回帰
SPSS で順序ロジスティック回帰を行う方法
順序ロジスティック回帰をSPSSで実施する方法の解説。 順序ロジスティック回帰とは? 順序ロジスティック回帰とは、目的変数が順序カテゴリの場合に、説明変数の多変量調整オッズ比を計算する回帰モデル。 SPSSでもEZRでも簡単に実行できる。 順序ロジステ... -
競合リスク
EZR で IPTW Fine-Gray 回帰を実施する方法
IPTW Fine-Gray 回帰を実施する方法 Fine-Gray 回帰とは? Fine-Gray 回帰とは、競合リスクがある場合の多変量調整回帰モデルの一つ。 詳しくは以下をどうぞ。 IPTW とは? IPTW とは、逆確率重みづけという意味である。 逆確率重み付けとは、逆確率という... -
基礎知識
変化量の標準偏差を推定する場合に分散の加法性が成り立たないことについて
連続量の前後比較の際に、先行研究のデータ等から、変化量の標準偏差を知りたいと思うことがある。 しかし、たいていは変化量の標準偏差は掲載されていない。 前と後、別々の標準偏差から、変化量の標準偏差が分散の加法性を使って推定できないか? 変化量... -
時系列データ分析
Comparative Interrupted Time Series とは何か どんな時に使うのが良いか わかりやすく解説
Comparative interrupted time series (CITS) は、どんな分析方法で、どんなときに使うのが良いか? CITSの前にITS 現実世界の状況として、集団全部に介入するということが起き、時系列データだけがあり、そのデータを分析せざるを得ないことはある。 その... -
回帰分析・線形回帰・重回帰
R の ggplot で書いた回帰直線に geom_smooth で 95 % 信頼区間を付ける方法
EZRで ggplot2 を使って95%信頼区間と回帰式付き回帰直線を描く方法。 EZRで回帰直線に95%信頼区間を描きたい場合どうするか? ggplot2 を使うと簡単・きれいに描ける。 ggplot で回帰直線を書く方法 ggplot2 とは? ggplot2 とは、簡単にきれいなグラフが... -
相関係数
R で書いた散布図に相関係数を書き入れる方法
散布図内に相関係数と95%信頼区間を書き入れる方法 散布図を R の plot() で書く 以下のように Y 軸の変数をチルダ( ~ )の左側に書き、X 軸の変数を右側に書く。 plot(LogCD34perBW ~ WBC.entry, data=GCSF_CD34) すると、以下のように散布図が描かれる... -
回帰分析・線形回帰・重回帰
EZR で書いた回帰直線に信頼区間を付ける方法
EZRで回帰直線のグラフに95%信頼区間を付ける方法 回帰直線を書くために EZRで線形回帰(単回帰)を実行する まずEZRで単回帰を実行する。 例えば、以下のような感じに R スクリプト窓に出力される。 #####線形回帰(単回帰、重回帰)##### library(aod, pos... -
同等性の検定
R と EZR で同等性検定に必要なサンプルサイズを計算する方法
積極的に同等であることを証明していく同等性の検定。 サンプルサイズ計算はどのようにすればよいか? 同等性検定はどのようにするのか? 同等性の検定は、簡単に言えば、非劣性検定の群を入れ替えて、片側検定を2回行うことで実施できる。 劣っていないが... -
マンホイットニーのU検定
SPSS でマンホイットニーの U 検定を実行する方法
SPSSでマンホイットニーのU検定を実施するにはどうすればよいか? SPSSでマンホイットニーのU検定を実施するサンプルデータ 今回使用するサンプルデータは文末の参考書籍で紹介されているデータ。 男女別にコンビニに行く頻度を比較するという解析である。... -
共分散分析
EZR で指数関数データをガンマ分布の一般化線形モデルで解析する方法
指数関数的に上昇するデータを共変量調整の回帰分析したい場合どのようにすればよいか? ガンマ分布の一般化線形モデルを使えばできる。 指数関数的に上昇するデータに対して共分散分析をあてはめようとすると サンプルデータは「データ解析のための統計モ... -
基礎知識
ANOVA Type I Type II Type III の違い
ANOVAには3つの種類がある。 Type I, II, IIIの3つ。 どんな時にどれを使えばよいか? RにおけるANOVAの種類:Type I ANOVA Rのデフォルトで使えるANOVAは、anova()とaov()である。 これらはともにType I と呼ばれるANOVAである。 Type I は、複数の因子... -
メタアナリシス
メタアナリシスの重み付けの話 ― 固定効果と変量効果の違い
複数の研究を統合するメタアナリシス。 固定効果モデルと変量効果モデルが存在する。 統合する際の重みが異なるのが一番の違い。 どんな重み計算をしているのか? メタアナリシスとは? システマティックレビューを行った複数の研究の効果量を統合する解析... -
回帰分析・線形回帰・重回帰
逆確率重み付け IPTW の説明と EZR で逆確率重み付け回帰を行う方法
逆確率重み付けとは、傾向スコアの逆数を用いて、人数があまり多くない層を厚くする方法で、処方の有無の背景をそろえる方法である。 重回帰で用いる方法。 逆確率重み付けとは? 逆確率重み付けは、Inverse Probability of Treatment Weighting が英語の... -
基礎知識
傾向スコアマッチングのキャリパーはどのくらいが適切か
傾向スコアマッチングのキャリパーはどのくらいが正解か? ネット上にある情報をまとめてみた。 マッチングのキャリパーとは マッチングのキャリパーとは、マッチする症例同士がどのくらいまで離れているのを許容するかという幅である。 例えば年齢をマッ... -
グラフ
EZR の ROC 曲線グラフの X 軸が逆向きになっているのを直す方法
EZR の ROC 曲線グラフのX軸を 1 - 特異度にする方法。 EZRでROC曲線を描く方法 EZRでROC曲線を描く方法はとても簡単だ。 「統計解析」→「検査の正確度の評価」→「定量検査の診断への正確度の評価(ROC曲線)」を選択する。 結果変数(2値)と予測に用いる... -
ログランク検定
R と EZR を使ったログランク検定計算のわかりやすい解説
生存時間解析に登場する群間比較検定のログランク検定。 いったいどんな計算をしているのか? わかりやすく解説。 ログランク検定とは? ログランク検定とは、以下のようなカプランマイヤー曲線で描かれるような生存時間データを群間比較する検定である。 ... -
線形混合モデル
SPSS で線形混合モデルを実行する方法
線形混合モデルをSPSSで実行する方法の解説。 反復測定データで、欠損値があってもできる限りデータを使用できる点で、反復測定分散分析よりも適切な方法だ。 線形混合モデルをSPSSで実行するために使用するサンプルデータ EZR公式マニュアル付属のデータ ... -
線形混合モデル
EZR で線形混合モデルを行う方法と反復測定分散分析との比較
EZR で線形混合モデルの解析方法 反復測定分散分析との違い 線形混合モデルの解析方法の前に 反復測定分散分析 解析の実践はEZRを使って行っていく。 使うデータは、EZR公式マニュアル付属の FCZ_CSA.rda である。 反復測定データ CDratio1, CDratio2, CDr... -
ロジスティック回帰
R でブートストラップ ロジスティック回帰分析を行う方法
ブートストラップとは、小さいサンプルを復元抽出で何度もサンプリングして、疑似的に何度も試行したことにして、その結果から推定値の直接的な95%の範囲を求めたりする方法。 ブートストラップを使ったロジスティック回帰分析の方法をご紹介。 ブートス... -
回帰分析・線形回帰・重回帰
EZR で共分散分析を行い回帰直線を比較する方法
共分散分析を使えば、2つの回帰直線の傾きや切片が異なるかどうか検討できる。 直接的な傾きの差の検定や切片の差の検定ではないが、同様な結果が簡単に得られるので、共分散分析でよいと思っている。 データの準備 こちらを題材として、EZRで再解析してみ... -
線形混合モデル
線形回帰モデルの種類と簡単な解説
線形回帰の種類をわかりやすく解説。 線形回帰とは? 線形回帰の線形の由来は、線形結合からきている。 線形結合とは、以下のような式で表されることを意味している。 $$ \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_n X_n $$ ここで β は (偏) 回帰係数の... -
ロジスティック回帰
EZR でロジスティック回帰の多変量 ROC 曲線を比較する方法
ロジスティック回帰の回帰診断の一つにROC曲線を活用する方法がある。 ロジスティック回帰モデルを多変量で行えば多変量ROC曲線となる。 モデルごとに算出されるROC曲線を比較するにはどのようにすればよいか? ROC曲線とは? まずROC曲線とは何か? ROC曲...
