使高斯核适应不连续空间

时间:2015-12-18 20:28:09

标签: machine-learning gaussian

如何使高斯核适应不连续的空间,例如有限字母表中的字符串,我们已经定义了一个内核(比如K(s,t))?

高斯核可以用:

表示

G(x,y)= e ^( - (|| x-y || ^ 2)/σ^ 2)

1 个答案:

答案 0 :(得分:0)

如果你想在你的内核K引起的希尔伯特向量空间之上建立一个高斯内核,你可以把它放在像

这样的东西上。
G_K(x, y) = e^(−(K(x, x)-2K(x, y)+K(y,y))/σ^2)

为什么没事?

G(x, y) = e^(−(||x−y||^2)/σ^2) = G(x, y) 
        = e^(−(<x-y, x-y>)/σ^2)
        = e^(−(<x, x>-<x, y>-<y,x>+<y,y>)/σ^2)
        = e^(−(<x, x>-2<x, y>+<y,y>)/σ^2)

因此给出了一个内核K,它是某个空间中的点积,意味着K(x,y) = <phi(x), phi(y)>得到

G(phi(x), phi(y) = e^(−(<phi(x), phi(x)>-2<phi(x), phi(y)>+<phi(y),phi(y)>)/σ^2)
                 = e^(−(K(x, x)-2K(x, y)+K(y,y))/σ^2)

因此,当G是一个有效的内核时,G_K(x,y)也是(因为它只是通过高斯投影和内核引起的变换的标量乘积)。