引入负相似的LNP算法
对比传统的SVM, LapSVM的最大特点就是添加了流形正则化项,反映无标签样本的儿间结构信息,强制使样本标签在图G=(V,E)上局部平滑分布,其中,结点V表示样本数据,边E表示两个样本之间有边存在,边的权值则表示了样本之间的相似程度。LapSVM 算法根据流形假设,同时利用有标签样本和无标签样本,调整分类超平面,进面保证特征相似的样本分在同侧。传统构图方法中边的权值一般采用高斯核函数方法,这种方法不仅需要较大存储空间,而且对高斯核宽度σ也极为敏感。为了解决以上问题,利用线性近邻传播算法中的构建图,自动赋值,构造一个能更好地反映 无标签样本信息的拉普拉斯矩阵。LNP算法的基本思想是用若干个近邻图估计一个包含所有样本的全图,任意样本xi∈X与其他样本的连接权重可以通过在近邻图中构造一个二次凸规划求得,然后将所有样本的边权重放在一个矩阵中,从而获得稀流性图的拉普拉斯矩阵。LNP算法是一种较为实用的半监督分类算法, 只需要调整一个近邻参数k。 LNP算法基于假设,样本点的分布在某个流形上足够平滑。
LNP算法可以分为两步: (1)构建邻城图,通过最小化重构误差,获得稀疏的全图: (2)同LP算法一样,通过权重矩阵,将有标签样本的信息通过迭代传递给其近邻标签,依次对样本进行标记,得到一个样本标签局部平滑的全图。与LLE算法类似,假设样本点x可以用近邻样本线性组合,通过最小化重构误差,获得局部邻城结构。