我正在使用Weka来计算给定数据集的概率。更具体地说,我正在使用KernelEstimator类。
对于良好的密度估计结果,带宽参数的选择至关重要,但我无法找出如何计算带宽参数。正在使用的内核函数是一个简单的Gaussian Kernel。有谁知道如何计算bandwith参数?
答案 0 :(得分:1)
你可以找到它here:
你会找到
m_SumOfWeights += weight;
double range = m_Values[m_NumValues - 1] - m_Values[0];
if (range > 0) {
m_StandardDev = Math.max(range / Math.sqrt(m_SumOfWeights),
// allow at most 3 sds within one interval
m_Precision / (2 * 3));
}
m_StandardDev后来用作高斯内核的“方差”,即你的带宽。