machine-learning - 数值是什么意思？

时间：2014-03-07 08:20:52

标签： machine-learning classification weka language-features

我正在使用Weka的NaiveBayes分类器。我听到了一些东西，我不确定它是否属实。有人告诉我，当我在weka中有数值时，较高的值具有较高的权重。是吗？

我的意思是如果第一个实例的feature1（是数字）的值是1并且第二个实例的该特征的值是2，是否意味着第二个实例必须对该特征具有更高的权重？

如果这是对的，如果我想改变它该怎么办？

例如，我定义了一个距离特征。但是，越接近越好，这意味着此功能的较低值必须具有更高的权重。

我应该如何在Weka中实现它？

答案 0 :(得分：0)

如果我理解正确，您会询问是否需要转换特征值，以使转换后的值与预测成比例。这取决于您选择的学习算法，它与Weka无关。对于大多数学习算法（如回归或决策树），您不需要应用此类逆变换。通常情况下，我只是将值保持原样，除非算法需要其他标准化，例如重新缩放或重新定位为零均值。