高光谱无监督特征提取方法进展
无监督特征提取方法主要用于处理无标签样本,不需要任何先验信息,不直接优化给定分类任务的精度,其目的在于找到限制条件下低维空间的数据表示形式。主成分析(PCA, princial comporent analysis )是无监督特征提取的经典方法之一,已被广泛应用于高光谱遥感图像数据处理。Richards 等川利用PCA的正交变换特性对高光谱遥感图像数据进行变换,去除波段相关性,实现维数降低和噪声隔离。随后,Jia等利用PCA沿对角线具有高度相关性的特点,提出了分块主成分分析法来提升计算速度。高光谱遥感图像亮度值变化和特殊类型噪声变异都会影响PCA的结果,对此,Cakir 等提出了标准主成分分析( S-PCA,standardized PCA )方法解决了图像亮度值变化的影响。Chang 等提出了干扰噪声调整主成分分析( INAPCA, interference and noise-adjusted PCA)方法,利用多元线性预测一个波段中包含的其他波段信号来去除波段间的相关性,以消除噪声。独立成分分析(ICA,independent components analysis )是一种分离重叠信号的统计技术,能从信息量很少的源信号中找到潜在的因素进行估计,得到相互独立的近似值。由于ICA能反映图像的全局、局部和边缘特征,因此ICA和形态变换相结合可用于高光谱遥感图像的城区地表覆盖分类。目前,基于ICA的数据维数降低和特征提取已在高光谱遥感图像数据分类中得到广泛应用,并表现出较好的效果。小波变换可以对不同尺度的光谱曲线进行高/低频提取,从而保留光谱特征,已广泛应用于高光谱遥感图像数据维数降低。Plaza等用扩展形态学变换序列来研究高光谱遥感图像数据的维数降低和分类。Harsanyi 等用正交子空间投影法研究高光谱遥感图像数据的维数降低和分类。此外,还有研究者分别利用奇异值分解和随机投影法来降低高光谱遥感图像数据的维数。从相邻像素间的空间关系来考虑,研究者提出了低秩张量近似和最小变化率偏差方法来降低高光谱遥感图像数据的维数。随着空间分辨率的不断提高,遥感图像数据的空间信息越来越重要,研究者充分利用空间信息来增强分类器的分类性能,如基于数学形态学滤波的特征提取方法、基于Gabor滤波器的空间纹理特征提取方法。从保留数据的局部邻域属性来考虑高光谱遥感图像数据维数降低的问题,有研究者提出了一些保留局部属性的维数降低法。而局部非线性方法主要是寻找高维数据中的低维结构,挖掘出高维数据的本质特征,能够得到无监督学习的全局和局部最优解,如局部线性嵌入( LLE,locally linear embedding)、拉普拉斯特征映射( LE, Laplacian eigenmap )和局部切空间排列( LTSA, local tangent space alignment )等已应用到高光谱遥感图像数据处理中。但是局部非线性方法的使用会遇到以下问题:一是样本溢出,即新样本不能映射到训练得到的流形结构中;二是高维数据有过重的计算和存储负担。为了解决以上问题,研究者提出了-些近似线性特征提取方法, 如邻域保持嵌入( NPE, neigighborhood preserving embedding)、局部保留映射( LPP, locality preserving projection)和线性局部切空间排列(LLTSA, linear local tanget space alignment)。大多数局部方法都是考虑原始数据点周围的相邻信息,利用数学变换或排列来保留原始图像数据周围的邻域信息,并检测嵌在高维特征空间的数据结构特征等。