什么是分类集群法?高分二号 地灾解译 ARCGIS制图
什么是分类集群法?
分级集群法(herechieal clustering)基用“距高"评价个体(每个数数据)间的相似程度,根据距离最近的原则判定并归并到同一个类别中的方法。归并后的类别作为新的个体,重新计算并改正其距离。在达到最终类别数以前,将重复个体间相似度的评价和归并,要逐渐汇集到各类别中去。这种归并的过程是分级进行的,归并到某类 别中的数据不会再移到其他分支上的类别中去。
表示个体间相似度的距离采用欧氏距离等若干种定义。此外在类别归并的过程中,必须计算新产生的类别与已有的类别之间的距离。根据距离的定义方式,分级集群的方法还可以进- 步分为若干种。
①最小距离法:当类别i 和j归并为类别k时,把k和其他类别h的距离dkh用dih(i和h的距离)djh(j和h的距离)的最小值来定义的方法。
dkh = min{dih,djh} (1)
②最大距离法:把类别k和h的距离用d.和d,的最大值来定义的方法。
dkh = max{dih,djh} (2)
③重心法:把类别间的距离用类别间重心的距离来定义的方法。距离采用欧氏距离来定义。
④群平均法:把类别间的距离用包含在两个类别中的所有个体间距离的平方的平均值来定义的方法。最初的个体间的距离用欧氏距离的平方来定义。
⑤ward法:把类别重心的个体位置的偏差平方和的增加量为最小的类别进行归并的方法。最初的个体间的距离采用欧氏距离。在利用欧氏距离进行相似度评价时,需要事先用主成分分析法使数据正交化。