2024年– date –
-
対応分析
R でテキストマイニングを行い対応分析でバイプロットを書く方法
R で形態素解析を行い、外部変数との対応分析を実行し、バイプロット(biplot)を書く方法の解説 前準備:データの読み込みから外部変数で分割したファイルの保存 テキストデータは、例えば、以下のようなデータを準備する ここで、comment が分析対象のテ... -
テキストマイニング
R でテキストマイニングを行い頻度表を作成し n-gram を書く方法
R でテキストデータを単語に区切り、頻度表を作成して、N-gram を書く方法を解説 テキストデータの読み込みから頻度表作成まで まず、前提として、MeCab と RMeCab をインストールしておく MeCab と RMeCab の準備については、以下の関連記事を参照 まず、... -
IPTW 逆確率重み付け
EZR でサンプルの IPTW 背景データのサマリー表を出力する方法
EZR で IPTW を作成したのち、IPTW 背景データのサマリー表を作成したい場合どうしたらよいか IPTW 背景データのサマリー表作成手順全体像 EZR で IPTW(逆確率重み)を作成したのち、IPTW 背景データの集計表を作成したい場合、どのようにしたらよいか 具... -
R
R の解析結果をきれいにエクセルに貼り付ける方法
R の解析結果をきれいにエクセルに貼り付けられると、とても助かる 簡単きれいにエクセルに貼り付ける方法のご紹介 clipr パッケージを使用する方法 clipr パッケージを使うと簡単である 使用する前にインストールしておく install.packages("clipr") 例え... -
傾向スコア
傾向スコア作成時に説明変数はいくつ入れてよいのか
傾向スコア作成時に、説明変数はいくついれてもよいのだろうか 最終モデルに交絡因子をたくさん入れないようにしたくて傾向スコアを使いたい場合利点があるのだろうか ロジスティック回帰分析における説明変数の数 傾向スコアは、ロジスティック回帰分析モ... -
基礎知識
傾向スコアを利用した解析
傾向スコアは、処方意向の確率を、背景因子で推測するという枠組みで計算される数値である 傾向スコアを用いることで、観察データを使用した、仮説に基づいた比較ができることになる 実際の利用方法を簡単に解説する 傾向スコアを利用した解析の総論 臨床... -
EZR
Mac に EZR をインストールすると英語版になってしまう件の対処法 2025年 6 月現在最新情報
日本語MacにEZRをインストールすると英語になってしまって困っている人へ 暫定結論 いったん R の完全アンインストール → 参考ブログ:https://dr-wolf.hatenablog.com/entry/2023/12/12/055302 R をインストール(R は最新版で問題なさそう) XQuartz 2.8... -
傾向スコア
傾向スコアを共変量にした調整はなぜダメなのか
傾向スコアを用いた解析はいくつか知られているが、傾向スコアを共変量にした解析は推奨されていない その理由は何か 傾向スコアを共変量にした調整は推奨されていない 傾向スコアを用いた解析は、主に以下の 4 つである 傾向スコアマッチング 傾向スコア... -
傾向スコア
傾向スコア法の利点と交絡因子の決め方
傾向スコア法は、交絡因子調整という点では、線形の多変量解析、例えば重回帰分析やロジスティック回帰分析と同様である しかし、線形回帰モデルとは異なる利点が存在する どんなときに傾向スコア法を用いるのが良いのか 傾向スコア法と多変量解析の比較 ... -
結果の書き方
重回帰分析の結果の書き方 ― 論文にはどの数値を書いたらよいか
教科書的には何を計算するかは決まっているが、論文にどの数値を掲載するかは決まっていない。 そういうときは、実例をもとに、まねするのが良いが、最低限の目安を示す。 回帰分析の結果の書き方の基本 一番大事な要素は、点推定値と95%信頼区間である。... -
傾向スコア
EZR で傾向スコアマッチングのバランス評価プロットを書く方法
傾向スコアマッチングの後に、バランス評価をするためのプロットを EZR で作成したいと考えた場合、どのようにするか 傾向スコアマッチングのバランス評価プロット 傾向スコアマッチングをした後に、マッチングのバランスを評価するプロットは、傾向スコア... -
クロスオーバー試験
EZR でクロスオーバー試験データを解析する方法
クロスオーバー試験は、一人の症例が複数の介入を受けることで、並行群間試験よりも効率よく行える試験 EZR でクロスオーバー試験データを解析する方法を紹介する クロスオーバー試験とは クロスオーバー試験とは、介入 A と介入 B の両方を同じ被験者で行... -
信頼区間
EZR で IPTW カプランマイヤー 曲線の生存期間中央値と 95 % 信頼区間を計算する方法
EZR で IPTW(逆確率重み付け)カプランマイヤー曲線の生存期間中央値と 95 % 信頼区間を計算する方法を紹介する IPTW カプランマイヤー曲線とは何か? IPTW(逆確率重み付け) カプランマイヤー曲線とは、傾向スコアの逆数を用いた IPTW で交絡因子を調... -
ROC曲線
EZR で時間依存型 ROC 曲線 を比較する方法
EZR では、時間依存型 ROC 曲線の曲線下面積を求めることができる では、2 つの時間依存型 ROC 曲線の曲線下面積を比較することはできるだろうか? 時間依存型 ROC 曲線とは 時間依存型 ROC 曲線とは、生存時間イベントデータを予測する連続データのカット... -
共分散分析
SPSS と EZR で共分散分析の群間比較における主効果・単純主効果・EM 平均を求める方法
SPSS で、一般線型モデルなどで求めることができる EM 平均(調整平均、調整推定平均、推定周辺平均など呼び方はいろいろあり)は、EZR ではどのように求めればよいか、emmeans パッケージを使って計算してみた 因子が二つで交互作用を考える場合 計算メニ... -
信頼区間
EZR でスピアマンの順位相関係数の 95%信頼区間を計算する方法
EZR で Spearman の順位相関係数の 95%信頼区間を計算する方法 デフォルトでは計算できないが、パッケージをインストールすると計算できる EZR で Spearman の順位相関係数を計算する方法 統計解析 → ノンパラメトリック検定 → 相関係数の検定(Spearman ... -
事後検出力
EZR で効果量・事後検出力・事後サンプルサイズ計算を行う方法
統計解析を実施して、結果を見て初めて、検出力やサンプルサイズの問題が意識されることは多い 手元にすでにあるデータから効果量を計算し、事後検出力、事後サンプルサイズ計算に進む流れを紹介する 事後に検出力やサンプルサイズ計算が必要になることは... -
データ加工
EZR で一人一行の反復測定データを一人複数行のデータに変換する方法
一人一行で反復測定データが入力されているときに、一人複数行のデータに変換したい場合、EZR ではどのようにするか? 反復測定データの準備方法には二つの方法がある 一人複数回測定しているデータの場合、一人一行で入力している場合(例:測定1、測定2... -
ノンパラメトリック検定
SPSS でフリードマン検定を行う方法
SPSS で対応のある多群のノンパラメトリック検定である、フリードマン検定を行う方法 概略 分析メニューのノンパラメトリック検定 → 対応サンプル というメニューから行う 対応サンプルのメニューを開いた後に、解析する変数を選択し、検定の種類を選択す... -
データ加工
SPSS で複数条件を満たす症例ごとに分けたカテゴリカルデータを作成する方法
SPSS で複数の変数を組み合わせた条件で、新たなカテゴリカルデータを作成したいことがある 複数条件を満たす症例ごとに分けたカテゴリカルデータを作成する方法をご紹介 状況設定と方針 例として、以下の X1, X2 という 2 つの変数の組み合わせで、X3 と... -
データ加工
SPSS でカテゴリ変数を別の区切りのカテゴリ変数にする方法
SPSS で、カテゴリ変数の区切り方を変えたい場合がある カテゴリ変数から別の区切りのカテゴリ変数を作成する方法 新しい区切りのカテゴリ変数の作成は「変換」から メニューバーの「変換」から、「他の変数への値の再割り当て」というメニューを選択する ... -
多重代入法
R で多重代入 IPTW Cox 回帰 ブートストラップ信頼区間を計算する方法
説明変数がいくつかある生存時間データで、いくつかの説明変数に欠損値があり、多重代入して IPTW Cox 回帰分析がしたい場合、R でどのようにすればよいか IPTW Cox 回帰の場合、ブートストラップ信頼区間がより適切であるが、それはどうやるか 多重代入と... -
多重代入法
R を使った多重代入で欠損値を補完した後、合計得点を計算して解析したい場合
多重代入法の際に、代入した変数を使って、合計得点などを計算して、最終的な解析がしたい場合がある そんなときに、どうすればよいか R で多重代入法を実施する方法の概要 R で多重代入法を行う基本的な方法は、以下の記事を参照 多重代入した後に変数同... -
多重代入法
R を使った多重代入法で欠損値を補完した後に Cox の Wald 検定のカイ二乗値を統合する方法
多重代入法で欠損値を補完した後に Cox 回帰の Wald 検定を統合する方法 多重代入法 多重代入法とは、欠損値を、取得されている変数から推測して、いくつかの値で補完して、いくつかのデータセットを作成し、解析したのち、結果を統合する方法 詳しくは、... -
多重代入法
EZR で多重代入法を行う方法
EZR で多重代入法を行いたい場合、どのようにしたらよいか EZR には、多重代入のメニューはないが、R スクリプト枠にスクリプトを書いていく方法で実行できる はじめに 欠損値(欠測値と同じ)があるデータセットにおいて、推定値にバイアスがかかると言わ... -
決定係数
重回帰分析における当てはまりの良さに関するいくつかの指標の違いと使い分け
重回帰分析(以下、線形回帰も同義)には当てはまりの良さの指標としていくつかあるが、それらの違いと使い分けはどうしたらよいのか? 自由度調整済み決定係数の特徴 説明率とも言われる決定係数の説明変数の個数を考慮したバージョン 0 から 1 の間の値... -
決定係数
決定係数が小さい場合の考え方
重回帰分析の評価指標の一つ、決定係数が小さいときに、どう考えたらよいか どのくらいの数値であったら、大丈夫なのだろうか 決定係数がどのくらいであれば意味があるか? 決定係数は、0.7 以上欲しいとか、0.5 でもよいとか、分野によっては 0.3 でもよ... -
基礎知識
標準化偏回帰係数の簡単な解説
標準化偏回帰係数(ひょうじゅんかへんかいきけいすう)とは何か? 一言で言えば、単位が異なる説明変数の、目的変数に対する影響力を比較したいときに、便利な数値と言える 順を追って、式なしでイメージだけでわかりやすく解説 標準化偏回帰係数の前に回... -
回帰分析・線形回帰・重回帰
SPSS を使ってやりたい解析別重回帰分析の実行方法
SPSS で重回帰分析をしたい場合、どのようにすればよいか やりたいこと別にまとめてみた 説明変数が連続データの場合で、交絡因子調整が目的の場合 目的変数、説明変数ともに連続データで、交絡因子調整が目的の場合は、以下のように解析する 分析 → 回帰 ... -
ロジスティック回帰
R で 制限付き 3 次スプライン曲線を二値アウトカムの場合に書く方法
制限付き 3 次スプライン曲線は、データの非線形関係をとらえるために書いてみるグラフのこと 二値のアウトカムの場合、R でどのように書くか紹介 制限付き 3 次スプライン曲線とは 制限付き 3 次スプライン曲線は、データの非線形関係をとらえるために用... -
基礎知識
統計解析における各種変数・データの呼び方を整理する
統計解析において、同じ意味合いで、違う呼び名が存在する それらを列挙して、整理したい 目的変数 研究の目的の項目、事項、事象、アウトカム、エンドポイントを測定、観測したデータのこと ほぼ同じ意味合いの言葉従属変数、応答変数、アウトカム、エン... -
R
R で IPTW の極端な重みを Trim によって Truncate する方法
IPTWにおける極端な重みのTruncation処理について 逆確率重み(IPTW)は、観察研究における交絡の調整手法として広く用いられているが、重みが極端な値をとる場合、推定量の分散が著しく増加し、結果が不安定になることがある そのため、極端な重みに対し...
1
