数值是什么意思?

时间:2014-03-07 08:20:52

标签: machine-learning classification weka language-features

我正在使用Weka的NaiveBayes分类器。我听到了一些东西,我不确定它是否属实。有人告诉我,当我在weka中有数值时,较高的值具有较高的权重。是吗?

我的意思是如果第一个实例的feature1(是数字)的值是1并且第二个实例的该特征的值是2,是否意味着第二个实例必须对该特征具有更高的权重?

如果这是对的,如果我想改变它该怎么办?

例如,我定义了一个距离特征。但是,越接近越好,这意味着此功能的较低值必须具有更高的权重。

我应该如何在Weka中实现它?

1 个答案:

答案 0 :(得分:0)

如果我理解正确,您会询问是否需要转换特征值,以使转换后的值与预测成比例。这取决于您选择的学习算法,它与Weka无关。对于大多数学习算法(如回归或决策树),您不需要应用此类逆变换。通常情况下,我只是将值保持原样,除非算法需要其他标准化,例如重新缩放或重新定位为零均值。