房屋特征优选的方法有哪些?
由于遥感影像通常是多波段的,用以描述图像对象的形状、纹理等特征参数多种多样,每个对象可以提取几十个乃至上百个图像特征。但是,特征间普遍存在的相关性(正或负相关)将造成特征冗余,并增加识别时的计算开销:而某一类地 物的许多特征与其他地物间并不存在显著的差异,这些特征被使用后将使得地物类别更难以区分,产生特征越多、精度越低的现象。不同地物目标的提取对应于不同的最优特征组合,增加冗余的、不显著的特征只会降低识别算法的性能,以及目标识别与提取效果。为提高识别精度,基于知识库进行特征优选,即从众多的特征中寻找到最能反映待识别目标特性的少量关键特征,在保证甚至提高识别精度的同时,提高识别的效率,便成为遥感目标识别研究的一项重要内容。传统的特征优选算法主要有经验分析法、主成分分析法、遗传算法等。
经验分析法:根据对实际待识别房屋的考察以及分类经验,从候选特征集中挑选出最具有代表性的特征组合从而用于本次识别过程。根据经验优化特征的方法充分运用了房屋识别经验,具有最大的灵活性和适用性,通常能够获得比较高的识别精度;但是该方法人为参与程度较高,识别效果取决于解译专家的经验水平,解译方法不具有通用性,难以应用到自动化、业务化的识别系统中。
主成分分析法:利用降维的思想把多个指标转化为少数几个综合指标。主成分分析是将原来具有一定相关性的n个指标(特征值)通过线性变换等方法重新组合成一组不相关的特征指标。在这些主成分中,按照差异从大到小排列,称为第主成分、第二主成分、第n主成分,通常会选用前k个主成分替代原有目标的n个指标进行特征分析。
在高空间分辨率的房屋目标识别中使用主成分分析法,利用前k个主成分能有效降低特征向量的维数,并在一定程度上保留原特征信息量。然而,这些主成分是通过原有特征值线性变换得来,每个主成分的计算仍需要所有原特征值,该方法降低了分类的复杂度,但不能降低特征提取的复杂度。同时,主成分的计算只是特征的数学变换,该变换本身并不具有任何意义,也就是第一主成分并不 -定 是该类地物区别于其他地物的最主要特征。因此,仅仅通过主成分分析方法不能获得最佳识别效果,该方法通常会作为其他特征优选方法的二次降维使用,以保证算法效率的同时,又保证特征的最优性。
遗传算法:是一种概率搜索算法,体现了优胜劣汰、适者生存的生物进化原理。搜索算法首先组成一组候选解,然后依据某些适应性条件测算这些候选解的适应度,再根据适应度保留某些候选解,放弃其他候选解,最后对保留的候选解进行某些操作,生成新的候选解,如此如同生物繁衍一代一代地迭代下去,当满足某个收敛条件后得到一个问题的较满意答案(不一定是最优解)。遗传算法的核心问题是评估适应度的设定,需要通过一个合适的评估策略恰当评估候选解的优越度,并尽量提高迭代函数的收敛速度。
由于房屋建筑的构建材质差异显著,不同建筑在光谱特征上不具有相似性,同时不同材质组成的屋顶表现纹理也有很大差别。水泥、沥青、瓦片、金属板等材料组成的屋顶纹理差别显著。形状上的特征更是千差万别:房屋所占面积从几十平方米的土坯房到几千平方米的工厂厂房,大小各异;屋顶结构有平顶房屋、坡顶房屋(单坡、双坡、四坡等)、拱形房屋(单拱、双曲拱、圆顶等),以及简单结构组成的复合型屋顶。
复杂结构的房屋建筑体现了建筑学的辉煌成就,却给房屋建筑的图像自动识别带来了极大的困难。对于一种建筑的特征参数往往不能应用到其他建筑的识别中,目前尚不存在一种通用的规则的自动获取方法。因此,在本章中将针对图像中房屋建筑的特征,根据经验结合待提取图像中房屋的特点选用适当的参数作为建筑分类的依据。