テキストマイニング– category –
-
テキストマイニング
R でテキストマイニングを行い対応分析でバイプロットを書く方法
R で形態素解析を行い、外部変数との対応分析を実行し、バイプロット(biplot)を書く方法の解説 前準備:データの読み込みから外部変数で分割したファイルの保存 テキストデータは、例えば、以下のようなデータを準備する ここで、comment が分析対象のテ... -
テキストマイニング
R でテキストマイニングを行い頻度表を作成し n-gram を書く方法
R でテキストデータを単語に区切り、頻度表を作成して、N-gram を書く方法を解説 テキストデータの読み込みから頻度表作成まで まず、前提として、MeCab と RMeCab をインストールしておく MeCab と RMeCab の準備については、以下の関連記事を参照 まず、... -
テキストマイニング
階層的クラスター分析で使われるウォード法とは? わかりやすく解説
階層的クラスター分析のクラスター化の方法のウォード法とはどういう方法なのか? クラスター化とは? 階層的クラスター分析はクラスター化をしていく。 クラスター化とは何か? 階層的クラスター分析では、最初にJaccard係数等の指標で、単語同士の「距離... -
テキストマイニング
Jaccard係数とは?― クラスタリングや共起ネットワークの類似度の指標
Jaccard 係数は集合の類似度を表す指標で、テキストマイニングでは、文章と文章の類似度=距離を表す指標になる。 Jaccard係数を少し詳しく解説。 Jaccard係数とは? Jaccard 係数とは、植物学者 Paul Jaccard が考案した集合の類似度を測る指標のこと。 ... -
テキストマイニング
R と MeCab でテキストマイニングを行う方法
Rでテキストマイニングするやり方。 MeCab と RMeCab を使う方法。 例として、ワードクラウドを描く方法を紹介。 テキストマイニングとは? テキストデータを名詞、動詞、形容詞など、濃い意味合いを持つ言葉と、助詞、助動詞、感嘆詞、疑問詞など意味合い...
1