2025年– date –
-
データ加工
時間の計算方法 一筋縄ではいかない時間の計算
ある時点からある時点までの日数や時間を計算したい場面は多い。しかし、計算の目的が「日数」なのか「時間」なのかによって、データの準備の仕方は異なる。特に時間は「60進法」や「日をまたぐ処理」があるため、単純な数値の引き算では失敗しやすい。 本... -
結果の書き方
回帰分析の結果の書き方:数値の意味から記述例まで解説
回帰分析の結果をレポートやブログにまとめる際、どの数値を拾い、どう表現すべきか。本記事では、初心者が必要最低限押さえるべきポイントを簡潔に解説する。 結果として表示する数値 分析ソフトの出力結果から、まず以下の3点を確認する必要がある。 偏... -
結果の書き方
サンプルサイズが小さい研究における論文執筆のポイント:有意差が出なかった際の考察法
研究計画を立てる際、理想的なサンプルサイズを確保できるケースばかりではない。特に希少な事象を扱う場合や、探索的な研究では、どうしても小サンプルにならざるを得ない状況がある。その際、多くの研究者が直面するのが「統計学的有意差が出ない」とい... -
基礎知識
リッカート尺度は「平均」を出してもいい?連続データとして扱う根拠と注意点
アンケート調査で頻繁に使われる「非常に満足」から「非常に不満」までの5件法。これを統計解析の際に「平均値」を出せる連続データとして扱ってよいのか、迷う実務者は多い。 厳密に言えば、リッカート尺度は順序を付けただけの「順序尺度」である。しか... -
回帰分析・線形回帰・重回帰
線形回帰の罠:なぜ「データの正規性」は必須ではないのか
統計学やデータ分析の初学者が線形回帰を学ぶ際、最初につまずくポイントがある。それが「正規性の仮定」だ。「分析対象のデータ(目的変数)が正規分布していなければ、回帰分析は使えない」と思い込み、分析を断念したり、無理なデータ変換を繰り返した... -
IPTW 逆確率重み付け
IPTWと共変量で調整する二重ロバスト推定:初心者向け解説
統計解析において「より正確な因果関係」を導き出すための強力な手法が、二重ロバスト推定(Doubly Robust Estimation)である。一見難解に思えるが、その仕組みは非常に合理的で「保険」をかけた解析手法と言える。 本記事では、初心者でも流れが掴めるよ... -
IPTW 逆確率重み付け
IPTWは何を目的に何をしているのか:ざっくりとした説明
新しい薬の効果を確かめたいとき、あるいは特定のマーケティング施策が売上に貢献したかを知りたいとき、理想的なのは「くじ引き」で対象者を分けることである。しかし、現実のデータ(観察データ)では、健康意識の高い人ほど薬を飲みがちであったり、特... -
おすすめ書籍
R言語を独学でマスターする ― おすすめ書籍5選と学習のコツ
データ分析の必要性に迫られ、何から手をつければいいか迷っている方は多い。 「EZRやRコマンダーなどのGUIツールは使っているが、より自由度の高い解析を行いたい」 「統計ソフトのブラックボックスを脱し、自分の意図通りにデータを制御したい」 本記事... -
基礎知識
統計学の落とし穴?「前提確認の検定」を避けるべき理由と正しい向き合い方
データ分析を行う際、「正規分布しているか?」「分散は等しいか?」と、手法を選ぶための「予備テスト(前提確認)」を行っていないだろうか。実は、この予備テストの結果を見てから本番の検定手法を選択する行為は、統計的な誤りを生む原因となる。本記... -
ROC曲線
アウトカムを最もよく予測するカットオフをROC曲線分析で見極めて、アウトカムを予測する回帰分析を行うことの是非
医療や疫学研究において、検査値のような連続データを「異常/正常」に区切るカットオフ値の設定は必須である。このカットオフ値を決定する強力な手法がROC曲線分析である。しかし、「ROC分析で最適化したカットオフ値を用いて二値化し、その結果をさらに回...
