这是为可变长度因子序列的分类定义合适内核的最佳方法。我使用kernlab与R。
谢谢!
答案 0 :(得分:1)
没有一般的好方法。可变长度因子意味着没有维度维度关系,因此合适的核函数完全依赖于数据(问题)。
然而,最基本的方法,假设你的因素只是一些大集合的元素是使用基于Jaccard的内核,
K(A,B) = |A n B|
简单地测量交叉点的大小。很容易证明它是一个有效的内核,因为人们可以考虑内核投影phi(A),它将集合A编码为第i个维度为“1”的位向量iff i'th element A中包含A的宇宙(A被采样).K定义了这些元素的常规标量积。
答案 1 :(得分:0)
你应该阅读:
动态时间扭曲(DTW)启发内核(具有PDS约束,例如全局对齐内核)。
字符串内核通常用于ADN结构分析(参见频谱内核,不匹配内核,......)。