满足分类器设计的分类要求是什么?高分三号 水文遥感 雷达扫描
满足分类器设计的分类要求是什么?
分类器设计就是要根据分类的具体情况选择分类特征、判据、准则、算法,把这四部分有机地组合起来,满足 具体的分类要求。
(1)特征选择
在分类器四个组成部分中,分类特征的选择最为复杂,探讨特征选择与算法的关系,包括:
①一次决策必须选择各类平均可分性最大的特征;
②多次划分必须针对划分的模式选择可分性最大的特征。
(2)判据选择
所有的分类都是以相似度作为判据的。表示相似度的判据有许多种,选择哪一种判据需要根据具体情况而定。一般来说,判据选择具有两个特点。
①判据选择要依据模式类的分布情况而定,一般分类判据应该反映模式类的分布。模式类的分布越复杂,采用的判据也应该越复杂。如果所有模式类分布比较简单,均线性可分,则使用一般的欧氏距离即可 ;如果模式类呈正态分布,一般应选用马氏距离;如果模式类线性不可分,则应采用似然度等更为复杂的判据。当然,判据并不能解决分类中的全部问题,遇上难分的模式类,还应该从特征和算法上作努力。
②判据选择要参考分类特征。如果选择光谱波形特征,则应选用光谱相似度或者光谱夹角。如果选择几个独立波段的反射率特征,则应该选择距离而不是光谱相似度或光谱夹角作为判据。一般来说,判据选择应该以分类为最终目的,如果选择的分类特征已经能够很好地反映各个模式类的区别,那么就可以选择比较简单的判据,反之则应该选择复杂一些的判据。
(3)准则选择
分类准则比较少,对于遥感图像分类来说,任何一个像元的分类错误带来的损失都是一样的,因此最小风险准则般不采用。 而对于似然分类来说,最小误差准则是最常用的。同样,在遥感图像分类中各类都是平等的,一般不会对某一类有特殊的要求,因此聂曼-皮尔逊准则也很少采用。
由于采用最小误差准则需要知道先验概率,而在一般情况下先验概率难以确定。相比之下,费歇尔准则虽然也是基于正态分布,但是它不需要知道先验概率,因此它是一种应用广泛的分类准则。
最小误差准则和费歇尔准则都是基于统计的分类准则,而最小二乘准则不基于统计分布。因此,最小二乘准则的应用不受任何先决条件的限制,其应用也十分广泛。
(4)算法选择
分类算法的选择也是根据模式类的分布情况决定的。一般来说,特征越多,算法越高级,则分类效果会越好。问题是如何尽量采用可以收到很好分类效果的简单的特征和算法。选择分类算法一般具有五个特点。
①若模式线性可分,则用最简单的算法即可,如最小距离分类算法。
②若模式非线性可分,则用非线性分类算法,如分层算法或神经网络算法等。
③若模式非线性不可分,一般应考虑对特征进行数学变换抽取新的分类特征,然后再选用非线性分类算法。
④若一次划分模式效果不好,则可以采用多次划分模式类的算法。
⑤特征选择与算法选择的效果都必须用测试分类精度来检验,反过来分类效果又作为特征选择与算法选择的依据。