层次聚类(Hierarchical Clustering)是一种聚类分析方法,通过构建层次结构树(树状图,Dendrogram)将样本数据逐渐合并或划分为不同的群组(簇)。层次聚类不同于K-means等非层次的聚类算法,它不需要提前指定簇的数量,而是通过树形结构自底向上或自顶向下地聚类。
层次聚类的两种主要方法:
- 凝聚式层次聚类(Agglomerative Hierarchical Clustering):
-
这种方法是自底向上的。它从每个数据点开始,每个数据点作为一个独立的簇。然后,逐步合并相似度最高的两个簇,直到所有数据点都合并成一个簇。
-
分裂式层次聚类(Divisive Hi...