-
テキストマイニング
階層的クラスター分析で使われるウォード法とは? わかりやすく解説
階層的クラスター分析のクラスター化の方法のウォード法とはどういう方法なのか? クラスター化とは? 階層的クラスター分析はクラスター化をしていく。 クラスター化とは何か? 階層的クラスター分析では、最初にJaccard係数等の指標で、単語同士の「距離... -
競合リスク
R で競合リスク回帰を実行する方法
競合リスク回帰とは、共変量調整をした競合リスク分析の方法。 競合リスク回帰の前に競合リスクとは? 競合リスクについては、以下を参照。 競合リスク回帰の種類 競合リスク回帰モデルには四つ考えられる。 絶対リスク回帰 Absolute Risk Regression ロジ... -
競合リスク
R で競合リスク分析 Gray 検定を行う方法
競合リスクとは何か? Gray 検定の実行方法 競合リスクとは? 再発がエンドポイントであったが、再発する前に死亡してしまったので、観察できなかった。 脳梗塞の発現がエンドポイントだったが、先に肺炎でお亡くなりになり、観察できなかった。 このよう... -
R
R で生存時間データを分析する方法
Coxの比例ハザードモデル(コックスの比例ハザードモデル、Cox回帰、コックス回帰など表示・呼び名はたくさんあるが皆同じものを指している)は、生存時間とイベントデータを多変量解析できる統計モデルだ。 注目したい要因が、他の要因と相関があり、また... -
ログランク検定
R でログランク検定を行う方法
ログランク検定とは、生存時間解析で、二群以上のグループがある場合に、グループ間で統計学的に差があるかを検討する方法。 R での方法を解説。 R でログランク検定をする場合の関数は? R でログランク検定をする場合、survival パッケージのsurvdiff()... -
グラフ
R でカプランマイヤー曲線をグループごとに書く方法
Rでカプランマイヤー曲線を書く方法の紹介。 survfit を使ったグループごとの曲線の書き方。 Rでカプランマイヤー曲線を書くためのサンプルデータ カプランマイヤー曲線を書くためのサンプルデータは、survival パッケージの lung を使う。 これは、North ... -
テキストマイニング
Jaccard係数とは?― クラスタリングや共起ネットワークの類似度の指標
Jaccard 係数は集合の類似度を表す指標で、テキストマイニングでは、文章と文章の類似度=距離を表す指標になる。 Jaccard係数を少し詳しく解説。 Jaccard係数とは? Jaccard 係数とは、植物学者 Paul Jaccard が考案した集合の類似度を測る指標のこと。 ... -
クラスタリング
R で階層的クラスタリングを行う方法
R で階層的クラスタリングを行う方法。 階層的クラスタリングとは さまざまな特徴を持った集団、たとえば米国50州を、特徴が似ている似ていないで近い・遠いを表現して部分集団(クラスター)に分けることを言う。 以下も参照のこと。 階層的クラスタリン... -
ユークリッド距離
R でユークリッド距離を二次元で表示してみた
二次元でユークリッド距離を図示してみた。 二次元のユークリッド距離を示すサンプルデータ 二次元でユークリッド距離を例示してみるためのサンプルデータは、R に組み込まれているUSArrestsというデータを使う。 USArrestsの1列目 Murderと2列目 Assault... -
ユークリッド距離
R でユークリッド距離を求める方法
ユークリッドは紀元前325年に生まれたギリシャの数学者。 著した著書は数学のなかでも特に幾何学の教科書として有名であった。 ユークリッドが考え出した「距離」とは? ユークリッド距離とは? ユークリッド距離は、幾何学で扱う事項である。 幾何学とは...