决策树分类
决策树是一个树型结构, 它由一个根结点、一系列内部结点及叶结点组成,每一结点只有一个父结点和两个或多个子结点,结点间通过分支相连。决策树的每个内部结点对应一个非类别属性或属性的集合(也称为测试属性),每条边对应该属性的每个可能值。决策树的叶结点对应一个类别属性值,不同的叶结点可以对应相同的类别属性值。一棵决策树描述了一组分类规则。
决策树方法是通过对训练样本进行归纳学习生成决策树或决策规则,然后使用决策树或决策规则对新数据进行分类的一种方法。决策树方法主要包括了两个过程,一个是决策树学习过程,另一个是决策树分类过程。
决策树分类是利用决策树或决策规则进行分类的方法,它是种非参数化的监督分类方法。在通过对训练样本进行决策树学习生成决策树后,决策树可以根据属性的取值对一个未知样本集进行分类。
在应用决策树分类规则进行分类时,通常采用如下策略:
①若仅激活一条规则(待分类数据的属性满足一条规则的条件),取规则的结果类别作为输出类别;
②若同时激活多条规则,则取置信度高的类别为输出类别;
③若同时激活多条规则,且类别的置信度相同,则取学习时覆被样本多的规则的结果为输出类别;
④没有规则被激活时,取缺省类别为输出类别。
决策树技术应用于遥感影像的土地利用/土地覆被分类过程有如下优点:一是决策树方法不需要假设先验概率分布,这种非参数化的特点使其具有更好的灵活性和鲁棒性,因此,当遥感影像数据特征的空间分布很复杂,或者多源数据各具有不同的统计分布和尺度时,用决策树分类法能获得理想的分类结果;二是决策树技术不仅可以利用连续实数或离散数值的样本,而且可以利用“语义数据”,比如在山区影像的分类中利用坡向信息(包括离散的语义数值:东、南、西、北、东南、东北、西南、西北),可以大大提高分类精度;三是决策树方法生成的决策树或产生式规则集具有结构简单直观、容易理解以及计算效率高的特点,可以供专家分析、判断和修正,也可以输入到专家系统中,而且对于大数据量的遥感影像处理更有优势:四是决策树方法能够有效地抑制训练样本噪声和解决属性缺失问题,因此可以解决由于训练样本存在噪声(可能由传感器噪声、漏扫描、信号混合、各种预处理误差等原因造成)使得土地覆被分类精度降低的问题。