2025年12月– date –
-
ネットワーク分析
Rのigraphで始める!ネットワーク分析入門:データの準備から可視化のコツまで
SNSのつながり、仕事の人間関係、単語の結びつきなど、複雑な関係性を目に見える形にしたいと考えたことはないだろうか。 そんな時、R言語で最も頼りになるのがigraphパッケージである。この記事では、Rを使い始めたばかりの読者に向けて、igraphの基本か... -
ネットワーク分析
サンキーダイアグラムで治療の遷移を可視化する:Rによる作成ガイド
「1次治療から2次治療へ、患者はどのように遷移しているのか?」 「どのタイミングで治療の切り替え(スイッチ)が多く発生しているのか?」 医療データや臨床研究の結果を報告する際、こうした「流れ」の把握は極めて重要である。そこで威力を発揮するの... -
ggplot2
ggplot2の図にテキストを書き入れる方法:目的別の使い分けと実践コード
Rのggplot2を使ってグラフを作成している際、「特定のデータ点に名前を入れたい」「グラフの余白に補足説明を追加したい」と考えたことはないだろうか。 グラフは視覚的にトレンドを伝えるのが得意だが、「言葉(テキスト)」を添えることで、読み手の理解... -
臨床予測モデル
ノモグラムの作成方法完全ガイド:RでのCox回帰モデル実装から活用法まで
「統計解析の結果を、もっと直感的に伝えたい」と思ったことはないだろうか。 複雑な回帰分析の結果を、定規1本で計算できるグラフに変換してくれるのが「ノモグラム(Nomogram)」である。本記事では、ノモグラムの基礎から、Rを使った具体的な作成方法、... -
ROC曲線
生存分析の予測精度を評価する「時間依存性ROC曲線」:Rでの実装まで解説
医療統計やデータ分析において、予測モデルの精度を評価する際に「ROC曲線」は欠かせない指標である。しかし、生存時間解析のように「時間の経過」が関わるデータでは、通常のROC曲線だけでは不十分な場合が多い。 そこで用いられるのが「時間依存性ROC曲... -
ROC曲線
Rで実践:3つ以上のROC曲線を1つのグラフにまとめる手法
医療統計や機械学習において、複数の予測モデルの性能を比較する際、ROC曲線(受信者動作特性曲線)を1つのグラフに重ねて描画することは、視覚的な評価において極めて重要である。 本記事では、Rの標準的なパッケージであるpROCを用い、1本から3本、さら... -
臨床予測モデル
ロジスティック回帰モデルの評価指標:混同行列からROC曲線、Youden Indexまで
ロジスティック回帰モデルを構築した後、多くの初心者は「正解率(Accuracy)」のみを見てモデルの良し悪しを判断しがちである。しかし、分類タスクにおいて正解率のみを指標とすることは、時として重大な判断ミスを招く。 本記事では、モデルの性能を多角... -
一致度
その数値は本当に正しいか?検査機器の妥当性を評価する「R²」と「Bland-Altmanプロット」の使い分け
新しい検査機器を導入する際、最も重要なプロセスは「その機器がどれだけ正確か」を客観的に証明することである。しかし、ここで多くの人が陥る罠がある。それは「相関関係(R²)さえ高ければ、機器の性能は十分である」と思い込んでしまうことだ。 本記事... -
サンプルサイズ計算
アンバランスな2群のサンプルサイズ計算ガイド:平均・割合・生存率のケース別解説
実務で統計を扱っていると、「比較したい2つのグループの人数がどうしても同じにならない」という場面に頻繁に遭遇する。例えば、希少疾患の治験で「新薬群」の患者確保が難しかったり、Webマーケティングで「新デザイン」をリスク回避のために一部のユー... -
データ加工
時間の計算方法 一筋縄ではいかない時間の計算
ある時点からある時点までの日数や時間を計算したい場面は多い。しかし、計算の目的が「日数」なのか「時間」なのかによって、データの準備の仕方は異なる。特に時間は「60進法」や「日をまたぐ処理」があるため、単純な数値の引き算では失敗しやすい。 本... -
結果の書き方
回帰分析の結果の書き方:数値の意味から記述例まで解説
回帰分析の結果をレポートやブログにまとめる際、どの数値を拾い、どう表現すべきか。本記事では、初心者が必要最低限押さえるべきポイントを簡潔に解説する。 結果として表示する数値 分析ソフトの出力結果から、まず以下の3点を確認する必要がある。 偏... -
結果の書き方
サンプルサイズが小さい研究における論文執筆のポイント:有意差が出なかった際の考察法
研究計画を立てる際、理想的なサンプルサイズを確保できるケースばかりではない。特に希少な事象を扱う場合や、探索的な研究では、どうしても小サンプルにならざるを得ない状況がある。その際、多くの研究者が直面するのが「統計学的有意差が出ない」とい... -
基礎知識
リッカート尺度は「平均」を出してもいい?連続データとして扱う根拠と注意点
アンケート調査で頻繁に使われる「非常に満足」から「非常に不満」までの5件法。これを統計解析の際に「平均値」を出せる連続データとして扱ってよいのか、迷う実務者は多い。 厳密に言えば、リッカート尺度は順序を付けただけの「順序尺度」である。しか... -
回帰分析・線形回帰・重回帰
線形回帰の罠:なぜ「データの正規性」は必須ではないのか
統計学やデータ分析の初学者が線形回帰を学ぶ際、最初につまずくポイントがある。それが「正規性の仮定」だ。「分析対象のデータ(目的変数)が正規分布していなければ、回帰分析は使えない」と思い込み、分析を断念したり、無理なデータ変換を繰り返した... -
IPTW 逆確率重み付け
IPTWと共変量で調整する二重ロバスト推定:初心者向け解説
統計解析において「より正確な因果関係」を導き出すための強力な手法が、二重ロバスト推定(Doubly Robust Estimation)である。一見難解に思えるが、その仕組みは非常に合理的で「保険」をかけた解析手法と言える。 本記事では、初心者でも流れが掴めるよ... -
IPTW 逆確率重み付け
IPTWは何を目的に何をしているのか:ざっくりとした説明
新しい薬の効果を確かめたいとき、あるいは特定のマーケティング施策が売上に貢献したかを知りたいとき、理想的なのは「くじ引き」で対象者を分けることである。しかし、現実のデータ(観察データ)では、健康意識の高い人ほど薬を飲みがちであったり、特... -
おすすめ書籍
R言語を独学でマスターする ― おすすめ書籍5選と学習のコツ
データ分析の必要性に迫られ、何から手をつければいいか迷っている方は多い。 「EZRやRコマンダーなどのGUIツールは使っているが、より自由度の高い解析を行いたい」 「統計ソフトのブラックボックスを脱し、自分の意図通りにデータを制御したい」 本記事... -
基礎知識
統計学の落とし穴?「前提確認の検定」を避けるべき理由と正しい向き合い方
データ分析を行う際、「正規分布しているか?」「分散は等しいか?」と、手法を選ぶための「予備テスト(前提確認)」を行っていないだろうか。実は、この予備テストの結果を見てから本番の検定手法を選択する行為は、統計的な誤りを生む原因となる。本記... -
ROC曲線
アウトカムを最もよく予測するカットオフをROC曲線分析で見極めて、アウトカムを予測する回帰分析を行うことの是非
医療や疫学研究において、検査値のような連続データを「異常/正常」に区切るカットオフ値の設定は必須である。このカットオフ値を決定する強力な手法がROC曲線分析である。しかし、「ROC分析で最適化したカットオフ値を用いて二値化し、その結果をさらに回... -
データ加工
連続データのカットオフ値の問題点:なぜ安易に区切ってはいけないのか
血圧を「高血圧」と「正常」に区切る130mmHgの壁、優良顧客と一般顧客を分ける100万円の売上ライン――私たちは連続的なデータを、わかりやすくするために特定のカットオフ値で二分しがちである。この単純化は、一見すると意思決定を迅速にする便利なツール... -
オッズ比
オッズ比とリスク比の違いを徹底解説
疫学研究や医療統計の論文には、「オッズ比(Odds Ratio: OR)」と「リスク比(Risk Ratio: RR)」、すなわち「相対危険(Relative Risk: RR)」が頻繁に登場する。これらはどちらも「ある要因が疾病や事象の発生にどれくらい影響するか」を示す指標である... -
交絡因子
交絡因子調整とは何か:初心者でもわかるデータ分析の基本
「あの薬を飲んだ者は、飲まなかった者より病気が治る割合が高い」――このような研究結果を聞いたとき、あなたは素直に「その薬が効いたのだ!」と信じるだろうか。 実は、データの世界では、二つの事象(例:薬の服用と病気の回復)の間に見かけ上の関連が... -
交絡因子
説明変数の選び方:統制すべき共変量に関するまとめ
統計的分析、特に「ある行動(処置)が、どのような結果(アウトカム)をもたらすか」を知りたい因果推論を行う際、どの変数をモデルに入れるか(=説明変数として統制するか)は非常に重要である。 間違った変数を選んでしまうと、せっかくの分析が台無し... -
欠損値・欠測値
データの「見えない値」をどう扱う?検出限界以下(ND)の値の正しい対処法
実験や分析でデータを得た際、「検出限界以下(Not Detected: ND)」という結果に直面したことがあるだろう。これは、物質が存在する可能性はあっても、測定機器では捉えられなかったことを意味する。 これらの「見えない値」を無視して「0」と入力したり...
1
