クラスター分析とは何か?
そもそも、クラスターって何?
目次
クラスターとは?
クラスターとは、グループとか塊(かたまり)の意味。
データをいくつかの塊に分けたものをクラスタと言う。
クラスター分析とは?
集めたデータをいくつかの塊に分けて、その特徴を見る方法がクラスター分析と呼ばれる。
クラスター分析にはいくつかの種類がある。
クラスター分析の種類
英語名 | 日本語名 |
---|---|
Connectivity-based clustering (hierarchical clustering) | 階層型クラスタリング |
Centroid-based clustering (k-means clustering) | k平均法 |
Distribution-based clustering | 分布に基づくクラスタリング |
Density-based clustering | 密度に基づくクラスタリング |
出典:
https://en.wikipedia.org/wiki/Cluster_analysis#Algorithms
階層型クラスタリング Hierarchical Clustering
階層を作って分類する方法。データ同士の「距離」を測って、遠い・近いで分類する。
デンドログラムと呼ばれる図を描く。

k 平均法 k-means Clustering
k 平均法のkは、任意の数で、1でも2でも3でもいい。
k の数だけのクラスターに分類する方法。
それぞれのクラスターの平均を使う。

Distribution-based Clustering
Expectation-maximization (EM) アルゴリズムを使ったGaussian Mixture Modelを代表とした分布に基づくクラスタリング。

Density-based Clustering
Density-based spatial clustering of applications with noise (DBSCAN)を代表とした密度に基づくクラスタリング。

まとめ
クラスター分析は、いくつかのデータの塊(クラスター)に分類する分析方法。
データの特徴・構造を見出す方法で、データマイニングの一手法。
階層型クラスタリングとk平均法は特によく知られている。
コメント
コメント一覧 (2件)
[…] クラスター分析とは? クラスター分析とは何か? そもそも、クラスターって何? […]
[…] クラスター分析とは? クラスター分析とは何か? そもそも、クラスターって何? […]