标签: machine-learning weka
我目前正在使用weka尝试使用包含真实值和错误值的训练数据来构建模型。这些值是从Internet上扫描数据集得出的。根据扫描的结果,任何特定的扫描可以包含不同数量的属性。我只是使用true和false来表示属性的存在。
这些属性用于预测是对还是错的类。
此方法是否导致我歪曲数据的含义?换句话说,当断言一个值是假的(肯定的)是因为该标志不存在时,我是在暗示我不该在那个数据上吗? (很难传达这个想法)
导致我问这个问题的是,当我用全为假的属性进行测试时,类预测应该为假,而事实并非如此。