2019年– date –
-
R
R で生存時間データを分析する方法
Coxの比例ハザードモデル(コックスの比例ハザードモデル、Cox回帰、コックス回帰など表示・呼び名はたくさんあるが皆同じものを指している)は、生存時間とイベントデータを多変量解析できる統計モデルだ。 注目したい要因が、他の要因と相関があり、また... -
ログランク検定
R でログランク検定を行う方法
ログランク検定とは、生存時間解析で、二群以上のグループがある場合に、グループ間で統計学的に差があるかを検討する方法。 R での方法を解説。 R でログランク検定をする場合の関数は? survdiff()はどうやって使う? ovarian データセットの内容 生存時... -
グラフ
R でカプランマイヤー曲線を書く方法 survfit を使ったグループごとの曲線
Rでカプランマイヤー曲線を書く方法の紹介。 survfit を使ったグループごとの曲線の書き方。 Rでカプランマイヤー曲線を書くためのサンプルデータ Rでカプランマイヤー曲線を書くための準備その1:Surv() Rでカプランマイヤー曲線を書くための準備その2:s... -
テキストマイニング
Jaccard係数とは?― クラスタリングや共起ネットワークの類似度の指標
Jaccard 係数は集合の類似度を表す指標で、テキストマイニングでは、文章と文章の類似度=距離を表す指標になる。 Jaccard係数を少し詳しく解説。 Jaccard係数とは? Jaccard 係数はどのように考えればいいか? Jaccard 係数の計算例 Jaccard 係数はどの方... -
クラスタリング
R で階層的クラスタリングを行う方法
R で階層的クラスタリングを行う方法。 階層的クラスタリングとは 階層的クラスタリングのサンプルデータ 階層的クラスタリングは実際にどうするか? まず距離計算をする 次にクラスターに分ける 距離計算はユークリッド距離を用いている 階層的クラスタリ... -
ユークリッド距離
R でユークリッド距離を二次元で表示してみた
二次元でユークリッド距離を図示してみた。 二次元のユークリッド距離を示すサンプルデータ 二次元空間にサンプルデータをプロットしてみる 二次元ユークリッド距離の計算例 二次元ユークリッド距離を計算する まとめ 関連記事 二次元のユークリッド距離を... -
ユークリッド距離
R でユークリッド距離を求める方法
ユークリッドは紀元前325年に生まれたギリシャの数学者。 著した著書は数学のなかでも特に幾何学の教科書として有名であった。 ユークリッドが考え出した「距離」とは? ユークリッド距離とは? ユークリッド距離の求め方実例 ユークリッド距離計算のサン... -
クラスタリング
クラスター分析とは?
クラスター分析とは何か? そもそも、クラスターって何? クラスターとは? クラスター分析とは? クラスター分析の種類 階層型クラスタリング Hierarchical Clustering k平均法 k-means Clustering Distribution-based Clustering Density-based Clusteri... -
一致度
R で 3 人以上の評価者の場合のカッパ係数 フライスのカッパ係数を計算する方法 Fleiss’ kappa
フライス(Fleiss)のカッパ係数(kappa)は、3人以上の評価者の評価が一致している度合いを測定する係数。 カッパ係数 3 人以上の場合 フライスのカッパ係数 Fleiss' kappa の計算式 カッパ係数 3 人以上の場合 Fleiss論文のデータを使って計算してみる ... -
一致度
R でカッパ係数を計算する方法 Cohen’s Kappa
二人の評価者のカテゴリ評価の一致度を見るのがいわゆるカッパ係数だ。 カッパはギリシャ文字のkのカッパ(κ)のこと。 Jacob Cohen先生が発明したので、Cohen's Kappaと呼ばれる。 これを R で計算してみようと思う。 irr パッケージを使う方法 Step by s...