我正在使用Weka的NaiveBayes分类器。我听到了一些东西,我不确定它是否属实。有人告诉我,当我在weka中有数值时,较高的值具有较高的权重。是吗?
我的意思是如果第一个实例的feature1(是数字)的值是1并且第二个实例的该特征的值是2,是否意味着第二个实例必须对该特征具有更高的权重?
如果这是对的,如果我想改变它该怎么办?
例如,我定义了一个距离特征。但是,越接近越好,这意味着此功能的较低值必须具有更高的权重。
我应该如何在Weka中实现它?
答案 0 :(得分:0)
如果我理解正确,您会询问是否需要转换特征值,以使转换后的值与预测成比例。这取决于您选择的学习算法,它与Weka无关。对于大多数学习算法(如回归或决策树),您不需要应用此类逆变换。通常情况下,我只是将值保持原样,除非算法需要其他标准化,例如重新缩放或重新定位为零均值。