下面是小编为大家整理的多核学习理论,供大家参考。
此外, 多核组合不确定性问题, 是多核学习(multiple kernel learning)
在实际应用中亟待解决的关键问题。
传统方法一般通过半定规划求解, 十分耗时, 且仅适用于无约束的线性组合结构。
再生核希尔伯特空间(ReproducingKernel Hilbert Space, RKHS)研究是在20 世纪 40年代开始的。
研究人员大都研究(1)
核函数权系数的选择问题。
如非平稳的多核学习方法,
局部多核学习方法, 非稀疏多核学习方法等(2)
多核学习理论。
如早期的基于 Boosting 的多核组合模
型学习方法,
基于半定规划(Semide¯nite programming,
SDP)
的多核学习方法,
基于二次约束型二次规划(Quadratically constrained quadratic program,
QCQP) 的学习方法,
基于半无限线性规划(Semi-in¯nitelinear program,
SILP) 的学习方法,
基于超核(Hyperkernels) 的学习方法,
以及近来出现的简单多核学习(Simple MKL) 方法和基于分组Lasso 思想的多核学习方法。
多核学习的算法流程
多核学习缺点:
尽管多核学习在解决一些异构数据集问题上表现出了非常优秀的性能, 但不得不说效率是多核学习发展的最大瓶颈。
首先, 空间方面, 多核学习算法由于需要计算各个核矩阵对应的核组合系数, 需要多个核矩阵共同参加运算。
也就是说, 多个核矩阵需要同时存储在内存中,如果样本的个数过多, 那么核矩阵的维数也会非常大, 如果核的个数也很多, 这无疑会占用很大的内存空间。
其次, 时间方面, 传统的求解核组合参数的方法即是转化为 SDP 优化问题求解, 而求解 SDP 问题需要使用内点法, 非常耗费时间, 尽管后续的一些改进算法能在耗费的时间上有所减少, 但依然不能有效的降低时间复杂度。
高耗的时间和空间复杂度是导致多核学习算法不能广泛应用的一个重要原因。
参考文献:
多核学习方法 基于多核学习的高性能核分类方法研究
一对其余法
一类对余类法(One versus rest, OVR) 是最早出现也是目前应用最为广泛的方法之一,其步骤是构造 k 个两类分类机(设共有志个类别) , 其中第 i 个分类机把第 i 类同余下的各类划分开, 训练时第 i 个分类机取训练集中第 i 类为正类, 其余类别点为负类进行训练。
判别时, 输入信号分别经过 k 个分类机共得到 k 个输出值 fi(x) =sgn(gi(x)) , 若只有一个+1 出现, 则其对应类别为输入信号类别; 实际情况下构造的决策函数总是有误差的, 若输出不只一个+1(不只一类声称它属于自 己) , 或者没有一个输出为+1(即没有一个类声称它属于自己) , 则比较 g(x) 输出值, 最大者对应类别为输入的类别。
这种方法的优点是, 对 k 类问题, 只需要训练 k 个两类分类支持向量机, 故其所得到的分类函数的个数(k 个) 较少, 其分类速度相对较快。