-
基礎知識
R にパッケージをインストールする方法
Rは、最初からかなりいろいろなことができる無料統計ソフト。 もっとすごいのは、あとからパッケージをインストールして、さらにいろいろな解析ができるようになること。 R は追加パッケージをインストールする前からすごい! まず、新しいパッケージをイ... -
基礎知識
R の引用情報を参考文献リストに載せたいときの書き方
R の引用情報を参考文献リストに載せたい。 どのように記載すればよいか? R の引用情報の取得方法 コンソールで citation() と書いてエンター。 引用の際の情報が出てくる。 例: To cite R in publications use: R Core Team (2018). R: A language and ... -
変数選択
多変量モデルの変数選択はどうすればいいのか?
多変量調整モデルの調整変数をどのように選ぶべきかは悩ましい。 統計ソフトにあるステップワイズ法は使っていいのか? 統計ソフトによっては、ステップワイズ法が準備されている。 ステップワイズ法とは、ステップを踏んで最良のモデルを見極める方法。 ... -
ロジスティック回帰
R で説明変数が連続データの場合にロジスティック回帰分析で必要なサンプルサイズを計算する方法
独立変数が連続量のロジスティック回帰のサンプルサイズ計算の方法 ロジスティック回帰のサンプルサイズ計算スクリプト 連続データの場合 p0を平均値レベルでの発生確率とする。 p1を平均値+1SD(標準偏差)レベルでの発生確率とする。 サンプルサイズ計... -
サンプルサイズ計算
R でマッチドケースコントロール研究に必要なサンプルサイズを計算する方法
マッチドケースコントロール研究のサンプルサイズ計算の方法 マッチドケースコントロール研究とは? 年齢、性別、など、病気に深くかかわっている因子だけど、研究対象にしたいわけでないとき、影響をなくしてしまいたい。 ケースとコントロールの重要な因... -
サンプルサイズ計算
R でケースコントロール研究に必要なサンプルサイズを計算する方法
ケースコントロール研究のオッズ比を求めるためのサンプルサイズ計算はどうやるのか? ケースコントロール研究のサンプルサイズ計算の前提 一般人の危険因子にさらされている割合をfとする。 想定されるオッズ比をRとする。 前提はこの二つだけだ。 この二... -
基礎知識
サンプル数が大きく異なる群間比較の妥当性
臨床研究では、比較的まれな疾患の患者さんのデータと、その疾患を持たない対照群のデータを比較しようとすると、両グループの人数が大きく異なることがよくある。これは、まれな疾患ではそもそもデータが集まりにくいという現実があるためだ。 このように... -
分散分析
R で分散分析に必要なサンプル数を計算する方法
分散分析のサンプルサイズ、サンプル数、n 数の計算を R でやってみた。 分散分析のサンプルサイズ計算(誤差分散がわかっている場合) 群の数をk、群間で最大の差(母平均の差の最大値)をd、誤差の母分散の平方根を sigma0 とする。 この場合の母分散は... -
相関係数
相関係数の目安と R で必要サンプル数を計算する方法
相関係数を求めたいサンプル数が少ないけど、大丈夫なのか? 相関係数が大きい場合、サンプル数は少なくても大丈夫。 目安となるサンプル数はどのくらいか? 相関係数の目安・意味 相関係数には、以下のような目安がある。 相関係数の絶対値関連の程度0.0... -
信頼区間
アンケート調査に必要なサンプル数を R で計算する方法
アンケート調査は何人にとったらいいか? アンケート調査に必要なサンプル数の前にアンケート調査の目的 アンケート調査に必要なサンプルサイズを考える前に、アンケート調査では、何をどうしたいのか? 「アンケート調査に必要なサンプル数」といった場合... -
信頼区間
アンケート調査には何人以上必要か R で計算する方法
アンケート調査には何人以上必要か アンケート調査には何人以上必要か 無限母集団の場合 よくある質問。 「アンケート調査は何人にとったらよいでしょうか。」 「世論調査のサンプル数は本当に意味があるのでしょうか。」 「視聴率調査のサンプル数はどう... -
信頼区間
R で割合の推定・検定に必要なサンプル数を計算する方法
割合に関するサンプルサイズ計算の方法 推定精度と検定の 2 種類あり 推定精度に基づく方法 相対精度deltaで,割合を推定する際のサンプルサイズ計算は、以下のような R スクリプトで計算できる。 myPsize <- function(p,delta){ n <- 4*(1-p)/(p*de... -
サンプルサイズ計算
R で対応のある t 検定に必要なサンプル数を計算する方法
対応のある t 検定は、前後比較をするデザインの時に用いる。 対応のある t 検定のサンプルサイズ、サンプル数はどのくらいであればよいか? 対応のある t 検定のサンプルサイズ計算に必要な数値 サンプルサイズ計算に必要なのは、 検出力 標準化された前... -
サンプルサイズ計算
R で t 検定に必要なサンプル数を計算する方法
t 検定のサンプル数計算の方法 t 検定のサンプル数計算(1:1の場合) R の power.t.test()を用いる。 必要な情報は、検出力をどうするかと、二群の平均値の差。 標準偏差で割った標準化された差が必要だ。 検出力は慣例で80%=0.8が多い。 90%=0.9もよく... -
グラフ
R と EZR でカプランマイヤー曲線を書く方法
カプランマイヤー曲線の書き方 R と EZR の方法。 カプランマイヤー曲線の書き方説明のためのサンプルデータ カプランマイヤー曲線を描きたい場合、イベント発生のデータとイベント発生までもしくは観察終了までの時間のデータが必要。 イベント発生データ... -
グラフ
R でグラフの軸目盛・軸ラベル・色の変更と値表示をする方法
統計ソフトRのグラフ上に数値を表示させたり、軸の目盛間隔や軸ラベルを変更する方法を紹介。 軸の数値をすべて縦にする las=1 軸ラベルのスタイル(the style of axis labels)。1は縦軸も横軸も縦方向の数字にする意味。 例: library(MASS) boxplot(bwt... -
基礎知識
R で QQ プロットを書く方法
正規確率プロット QQプロット は、正規分布をしているかどうか、目視で確認するための方法。 図で正規分布のチェック qqnorm()を使う。 正規確率プロットを描く。 x軸が正規分布の論理的な分位数、y軸が実測値の分位数。 対角線上にまっすぐに、プロットが... -
基礎知識
R で連続データの 2 群比較を行う方法
実験群とコントロール群、リスク因子あり群となし群、介入群と非介入群、など二群比較 を R で実行する方法。 群ごとに平均値・標準偏差・中央値を求める 平均値を計算するなら tapply(var1, grp, mean) を使用する。 grpのグループごとに、var1の平均値を... -
非劣性検定
非劣性マージンの決め方と R で非劣性検定を実行する方法
いままでの方法と比べて、格段にいいとか、際立っていいとか、じゃなくてもいい場合がある。 ダメじゃなければいい。 劣っていなければいい。 劣っていなければいいという検定方法が、非劣性(ひれっせい)検定だ。 じゃ、どういうときが劣っていないって... -
信頼区間
メタアナリシスのために信頼区間から標準誤差を逆算する方法
メタアナリシスをしたい場合、統合する点推定値と標準誤差が必要になる。 曝露有り無しと疾患ありなしが生データとして入手できる場合は問題ないが、多変量調整のあとの点推定値と95%信頼区間しかない場合は多い。 点推定値+95%信頼区間しか手に入らない... -
メタアナリシス
R で出版バイアスの検定を行う方法
Begg検定、Egger検定、Macaskill検定という出版バイアスの検定方法の解説。 出版バイアス検定のための個々の研究データ 出版バイアスを検定するためのサンプルデータは以下の通り。 a <- c(3,7,5,102,28,4,98,60,25,138,64,45,9,57,25,65,17) n1 <- ... -
メタアナリシス
R でメタアナリシスのファンネルプロットを書く方法
ファンネルプロットとは何か? 出版バイアスとは何か? フォレストプロットとの違いは何か? ファンネルプロットの前に出版バイアスとは? 出版バイアスとは、公表されている論文に偏りがあることだ。 統計学的有意になった結果が公表されやすい。 また、... -
メタアナリシス
R でメタアナリシスのフォレストプロットを書く方法
メタアナリシスのフォレストプロットの書き方の解説 R の metafor パッケージを使う方法 統合値の計算 metaforパッケージを使う。 最初一回だけインストールする。 install.packages("metafor") 使用するデータは以下の通り。 a <- c(3,7,5,102,28,4,98... -
メタアナリシス
R で制限付き最尤推定量 REML でオッズ比を統合するメタアナリシス
オッズ比を制限付き最尤推定量 REML で統合する方法の解説。 R で実行する。 制限付き最尤推定量でオッズ比を統合する意味 オッズ比のメタアナリシスをするときに、対数を取るのは正規分布に近似した分布にしたいからだ。 漸近的正規近似と呼ぶ。 漸近的正... -
メタアナリシス
R で DerSimonian-Laird 法でオッズ比を統合するメタアナリシス
各研究で無視できない異質性がある場合でも、適切にメタアナリシスできる方法の解説。 メタアナリシスのデータ準備 使用するデータは以下の通り。 a <- c(3,7,5,102,28,4,98,60,25,138,64,45,9,57,25,65,17) n1 <- c(38,114,69,1533,355,59,945,632,... -
メタアナリシス
R でマンテル・ヘンツェルの方法でオッズ比を統合するメタアナリシス
オッズ比をマンテル・ヘンツェル(Mantel-Haenszel)の方法で統合する方法の解説。 マンテル・ヘンツェル法は、2x2の分割表を統合する方法で、層別解析の方法。 メタアナリシスに応用する方法。 マンテル・ヘンツェル法の準備 データは以下の通り。 a &... -
メタアナリシス
R で漸近分散法でオッズ比を統合するメタアナリシス
メタアナリシスのためにオッズ比を統合したい場合で、それぞれの研究のサンプルサイズが大きい場合、オッズ比の対数が漸近的に正規近似できる。 個々の研究のサンプルサイズが大きい場合は、漸近分散法を使う。 使用するデータの準備 データは以下の通り。... -
メタアナリシス
R で Peto の方法でオッズ比を統合するメタアナリシス
メタアナリシスは、いくつかの研究で算出された数値を、適切に統合する方法。 一つ一つの研究では、検出力が不足していたものが、統合することで検出力を増し、統計学的に判断がつくようになる。 メタアナリシスの結果は、エビデンスレベルが高いと評価さ... -
確率分布
R で逆ガンマ分布のグラフを描く方法
逆ガンマ分布はどんな分布で、いつ使うのか? 逆ガンマ分布は、ベイズ統計学で、共役事前分布として登場する。 R で逆ガンマ分布のグラフを描く方法を紹介。 逆ガンマ分布はどのようなときに使うのか? 逆ガンマ分布は尤度計算のデータ母集団の確率分布が... -
確率分布
R でガンマ分布のグラフを描く方法
ガンマ分布とはどんな分布か簡単に解説しながら、R でガンマ分布のグラフを描く方法を紹介 ガンマ分布とは? ガンマ分布は、ある期間ごとに1回起こることが、何回か起こるまでの時間の分布。 たまにしかおきない、まれにしかおきない、という感じがポアソ... -
確率分布
R でベータ分布のグラフを描く方法
ベータ分布は、ベイズ統計学で二項分布の共役事前分布(きょうやくじぜんぶんぷ)として登場する分布。 ベータ分布の前に共役事前分布って何? ベータ分布は、二項分布の共役事前分布だ。 二項分布については、こちらを参照。 共役事前分布の共役(きょう... -
確率分布
R で二項分布のグラフを描く方法
R で二項分布のグラフを書いてみた 二項分布のグラフの前に 二項とは? 二項とは、0か1か、YesかNoか、表か裏か、など二つに一つが選ばれること。 二項分布は、二項の場合の分布という意味である。 二項分布のグラフを書いてみる たとえば、10例で、確率5... -
確率分布
t 分布 と t 検定の関係
t分布とは何か?t検定とどう関係するのか? t分布とはいったい何なのか? t検定とはよく聞くが、それとt分布は関係あるのか? t分布は要するに何なのか? 実は、t分布は標準正規分布の代わりだ。 どんなときに代わりとして使うか。 2つ条件がある。 母分散... -
確率分布
R で正規分布のパーセンタイルを計算する方法
平均70点、標準偏差15点のテストの場合、90点以上の学生は上位何パーセントに当たるか? という問題に使うパーセンタイル percentile とクォンタイル quantile。 それぞれ百分位数と分位数ともいわれる。 パーセンタイルを求めるには? pnorm()を使う。 母... -
確率分布
R で正規分布のグラフを書く方法
正規分布を R で書く方法の解説 正規分布を R で書く方法 curve()を使う。 dnormが、正規分布にしたがう確率分布を計算する。 横軸の範囲は-4から4としている。 3つの分布とも平均0とする。 R のスクリプトは以下の通り。 curve(dnorm(x,mean=0,sd=1.0), f... -
確率分布
R でポアソン分布のグラフを描く方法
R を使ったポアソン分布の書き方の解説 ポアソン分布とは? ポアソン分布は、数学者ポアソンが発表した、離散確率分布。 離散とは、離れているということ。 0回、1回、2回、3回・・・が生じる確率だ。 ラムダλ が1の場合の 0 から 10 までの確率を計算して... -
多重共線性
R で多重共線性をチェックするために VIF を計算する方法
重回帰分析で、変数選択において、考慮しないといけないのが、多重共線性。 多重共線性のチェックは統計ソフトRでどうやるのか? 多重共線性とは何か? 生まれた西暦年と年齢は、どのくらい相関するだろうか? 全く一致するといっても言い。 生まれた月に... -
負の二項回帰
R で負の二項回帰モデルを実行する方法
負の二項回帰モデルを R で行う方法 負の二項モデルを R で行う方法 まず、データを読み込む X <- c(rep(1, 913), rep(2, 1345), rep(3, 519), rep(9, 863)) Y <- c(rep(0, 910), rep(1, 2), rep(2, 1), rep(4, 0), rep(0, 1333), rep(1, 11), rep(2... -
トレンド検定
R で傾向検定を行う方法
傾向検定は、サンプルデータで観察された、平均値や割合が、だんだんに大きくなる、だんだんに小さくなるという傾向が、母集団でもその通りか検定するもの。 Rでどのようにやるかまとめてみた。 単変量の傾向検定:コクラン・アーミテージ検定 回答の選択... -
医療経済
R で薬剤経済分析を行う方法
薬剤経済学は、薬剤の持つ効力を、経済で測って吟味する学問。 新薬につけた薬価が、本当にその薬価に見合った効果を発揮しているかを吟味し、政策に生かそうとする学問。 薬剤経済学の書籍にそって実践してみる ネタ元は、坂巻弘之 著 やさしく学ぶ薬剤... -
対応分析
R でコレスポンデンス分析を実施する方法
コレスポンデンス分析(対応分析)とは、人の属性の類似性(もしくは対応)を図に表す分析。 結果を見るといろいろと解釈したくなる、面白い分析。 R では、caというパッケージで分析可能。 コレスポンデンス分析のパッケージ ca をインストールして準備する... -
ベイズ統計
R でギブスサンプリングを実施する方法
ギブスサンプリング(ギブス法)を R で実施する方法。 初期値を与えて、何度もサンプリングしていると、だんだんに形になってくる。 ギブスサンプリング用のデータの用意 heikinという名前のデータを入力する。 heikin <- c(6.0,10.0,7.6,3.5,1.4,2.5,... -
信頼区間
R でアグレスティコウルの割合の信頼区間を計算する方法
R で母比率(母集団における割合)の区間推定を行う方法。 母比率の信頼区間(Agresti & Coull の方法) sを、success 分子(該当数)とする。 nを、number 分母(サンプルサイズ)とする。 Functionは以下の通りだ。 bohiritu.conf <- funct... -
メタアナリシス
R で診断検査の感度・特異度を統合するメタアナリシス
診断検査を統合する方法 感度・特異度のメタアナリシス 感度・特異度のメタアナリシスとは 診断検査の性能を見るのに、感度・特異度は欠かせない。 病気ありをきちんと診断できる割合が感度。 病気なしをきちんと病気なしと除外できる割合が特異度。 必要... -
サンプルサイズ計算
R で ROC 曲線の比較に必要なサンプル数を平均値・標準偏差を用いて計算する方法
ROC 曲線の比較に必要なサンプルサイズの計算方法の紹介 検査値の平均値と標準偏差を用いる方法 ROC 曲線の比較に必要なサンプル数計算の準備 R で ROC 曲線の比較に必要なサンプルサイズ計算をするための準備。 まず、pROC パッケージをインストールする... -
サンプルサイズ計算
R で ROC 曲線の比較に必要なサンプル数を偽陽性率・陽性率・AUC を用いて計算する方法
ROC 曲線の比較に必要なサンプル数 サンプルサイズを計算する方法 ROC 曲線の比較に必要なサンプル数を計算するために必要な数値 ROC 曲線を比較したい検査値を、検査値 1、検査値 2 とする。 まず、先行研究から、以下の数値を読み取る。 False positive ... -
サンプルサイズ計算
R で ROC 曲線分析に必要なサンプル数を計算する方法
ROC曲線分析をしたいが、何人のデータを集めたらいいかわからない。 こんなときどうするか? ROC 曲線分析に必要なサンプル数の計算を R で行う準備 まずpROCパッケージをインストールする。 インストールは一回でOK。 install.packages("pROC") 毎回呼び... -
グラフ
R で ROC 曲線を書く方法
ROC 曲線を R で書く方法をわかりやすく解説 ROC 曲線とは? ROC曲線は、病気の診断のための検査を分析するために使われる。 真実の分類と、真実の分類を見分ける検査結果を使って、どのレベルより上だと病気とするか?を決める分析ツール。 胃がんや大腸... -
多重比較
SPSS で Kruskal-Wallis 検定 の Post-hoc test ステップワイズのステップダウンを実行する方法
Post-hoc test をSPSSで実施する方法 例えば、5 件法の回答の 3 群をKruskal-Wallisで検定した後の多重比較方法 Kruskal-Wallis検定の Post-hoc testをSPSSで実施する方法 3 つのグループに対して、まったく当てはまらない~非常に当てはまるの 5 段階の選... -
コックス回帰
SPSS の Cox 回帰で 3 群のカテゴリ変数を使う方法
比較したい群が3つあり、第1群と第2群、第1群と第3群のハザード比を求めるにはどうしたらいいか? SPSS の Cox 回帰で 3 群を比較したい状況 3群の生存比較において、SPSSを使ってCoxのハザード比を算出したい場合、どのようにすればよいか。 3群は群を表... -
ノンパラメトリック検定
R でマンホイットニーの U 検定に必要なサンプル数を計算する方法
マンホイットニー U 検定のサンプルサイズ計算の方法 マンホイットニーの U 検定 サンプルサイズ計算 R の”samplesize"というパッケージで、マンホイットニーの U 検定のサンプルサイズ計算ができる。 samplesize パッケージのn.wilcox.ord()を使う。 マン... -
信頼区間
SPSS でクロッパーピアソンの割合の信頼区間を計算する方法
SPSS で割合の 95 % 信頼区間を計算する方法の解説 SPSS で割合の 95 % 信頼区間を計算するサンプルデータ 統計ソフトSPSSで、比率の信頼区間はどのように求めるのか。 例えばn=100のサンプルで60人がテストに合格したとき、合格率60%の95%信頼区間はどの...
