用于kernlab中可变长度因子序列分类的核

时间:2014-05-27 06:57:09

标签: r machine-learning kernel kernlab

这是为可变长度因子序列的分类定义合适内核的最佳方法。我使用kernlab与R。

谢谢!

2 个答案:

答案 0 :(得分:1)

没有一般的好方法。可变长度因子意味着没有维度维度关系,因此合适的核函数完全依赖于数据(问题)。

然而,最基本的方法,假设你的因素只是一些大集合的元素是使用基于Jaccard的内核,

K(A,B) = |A n B|

简单地测量交叉点的大小。很容易证明它是一个有效的内核,因为人们可以考虑内核投影phi(A),它将集合A编码为第i个维度为“1”的位向量iff i'th element A中包含A的宇宙(A被采样).K定义了这些元素的常规标量积。

答案 1 :(得分:0)

你应该阅读:

  • 动态时间扭曲(DTW)启发内核(具有PDS约束,例如全局对齐内核)。

  • 字符串内核通常用于ADN结构分析(参见频谱内核,不匹配内核,......)。