高光谱分类方法进展
针对高光谱遥感图像数据的特点,目前大多采用支持向量机( SVM, support vector machine) 分类器进行教据分类。SVM是建立在在统计学习理论上的一种监督学习算法,采用结构风险最小化原则,在保证测试集与训练样本有较小误差的同时能够提高模型的泛化能力。SVM通过求解优化问题,将原始样本变换到高维特征空间,在变换后的空间中寻找最优分类超平面,实现数据分类。 SVM可以舍弃大量训练样本的束缚,只用少量训练样本就能达到很好的泛化能力且具有较高的分类精度。因此,SVM已成为小样本商维教据分类研究的重要方法。在实际应用中,通常将二分类SVM推广到多分类来求解问题,并将每个判别结果按照一定的方式组合。 但是SVM在求解大规模优化问题时学习速度慢,所需存储空间大。Camps-Valls等提出将核矩库分解为一系列的子矩阵,并在迭代过程中不断更新训练样本集来满足最优条件,提高学习速度。Zhang等为了克服原始SVM的尺度敏感性缺点,提出了者在支持向量机(P-SVM. potential SVM)。为了降低计算复杂度和存储量,Suykens等提出了最小二乘支持向量机( LS-SVM, least squares SVM),用求解线性方程代替计算量较大的二次规划,LS-SVM在高光谱遥感图像数据分类中已广泛应用。
在SVM及其各种变形算法中,核函数的选择和核参数的设置对高光谱遥感图像数据的分类精度都有影响,实际应用中需要选择合适的核函数以及核参数。SVM是核方法研究中最具代表性的工具,核方法不仅使SVM的结构框架更加清晰,而且提供了新的研究思路和方法。利用高光谱遥感图像的光谱和空间信息构造新的核函数,实现遥感数据异构特征的融合并提高其分类性能是目前研究的热点。由于光谱信息在波段上的分布不均匀,简单的波段选择很可能忽略掉许多重要的信息。Guo等利用波段加权策略来构造波段加权核SVM优化问题进行梯度下降求解,利用遗传算法和交叉验证策略选择高斯核参数,再利用SVM进行分类。Qi 等对不同光谱特征进行加权来提高SVM的分类性能,其本质和波段加权类似。因此利用不同权重设计核函数能提高SVM的分类性能。
CampsValls等利用空间和光谱信息构造出空谱混合核来提升高光谱遥感图像数据的分类性能,研究表明线性加权混合核的计算简单且分类效果较好。有研究者结合数学和地学方法提取高光谱遥感图像数据的空间特征并构造空谱核,用于提升分类精度Favel等用数学形态学提取空间特征并与光谱特征结合构成空谱核。Tan等利用主成分特征、光谱特征和小波特征构成混合核用于高光谱遥感图像数据分类并得出较好的分类结果。Hung等将矢量叠加、多SVM模糊输出和投票三者集成,详细分析它们在不同尺度上的分类性能,进一步证实了空间信息能增强类分离性,随后Huang等将光谱、空间结构和语义异构特征结合起来,提出基于SVM的多特征集成分类法。谭琨和杜培军提出了不同尺度下的小波核SVM分类方法。Du等对多分类器系统遥感图像数据分类进行总结,并指出串联或并联组合的分类器系统能够提高分类精度,Du等进步将数据融合、 多特征及集成学习三者相结合提升高光谱遥感图像数据的分类性能。以上研究表明,空谱核方法对高光谱遥感图像数据分类问题展现了较强的分类能力,提高了整体分类精度,但目前尚无相应的理论指导。
将监督和非监督特征提取方法与机器学习方法相结合来处理高光谱遥感图像数据的分类问题是目前研究的趋势。Patra 等提出采用聚类假设解决高光谱遥感图像数据分类中不确定样本标签的归属问题。Tuia等将监督和非监督方法相结合并采用主动学习策略提高高光谱遥感图像的分类精度。刘康等将主动学习与流形学习相结合来增强高维空间数据的分离性,但计算复杂度较高,不适用于规模较大的数据集。吴健等利用概率值差异度量无标签样本,并提出一种基于最小差异采样主动学习策略来提高分类精度。主动学习已在高光谱遥感图像数据分类中得到应用。