我只需运行
即可使用scipy
库执行高斯核密度估算
from scipy import stats
kernel = stats.gaussian_kde(data)
但我想将协方差修正为某个预定义值并使用它执行KDE。有没有一种简单的方法可以在python
的帮助下实现这一点,而无需明确编写优化过程(如果没有现有的库提供此类功能,我会这样做,但我希望避免使用它。)
答案 0 :(得分:2)
来自我的评论:
通常,对于密度估计,所涉及的高斯函数用作“窗口”函数,并且该窗口的“协方差”(实际上是1-D情况下的带宽参数)仅用于控制窗口的响应如何下降作为被测点距离的函数关闭。我不熟悉任何寻求使用特定的多元协方差结构来实现这种窗口衰减效应的KDE程序。
我还猜测,在实践中最常见的最复杂的“协方差”是对角矩阵,你只需要为数据的每个维度使用不同的带宽参数。也许(这可能是非常脆弱的)你可以对数据的主要方向进行某种PCA细分并将不同的带宽放在那里,但我认为除非数据方向有着截然不同的尺度,否则这种情况极不可能得到回报。在开始使用KDE之前,最好先对输入进行评分,并使用一个带宽。
如果您从scikits.learn及其KDE examples的文档中读取KernelDensity class,它们似乎(如SciPy)它们只为您提供带宽功能(单个浮点数)总结内核的repsonse应该脱落的方式。
对我而言,这表明对多变量带宽设置进行大量控制并没有多大实际意义。最好的办法是执行一些评分或标准化来转换输入变量,使它们具有相同的比例(以便在相同比例的每个方向上平滑),然后使用KDE预测或分类值转换空间,如果要返回原始缩放空间,则对每个坐标应用逆变换。