WEKA中省略值和未知值之间的区别是什么

时间:2012-06-04 04:42:51

标签: machine-learning data-mining weka

WEKA中属性的未知值和省略值之间有什么区别? 我了解到,对于一个缺失值,我们把?标记为相应属性的值,0表示省略的值。有什么不同。

假设我们要在n维空间中绘制数据,那么未知值将如何沿其轴表示,因为它们不为零。

由于 Abhishek S

1 个答案:

答案 0 :(得分:1)

每个分类器对未知值的处理方式不同。例如,有些人会将该特征的平均值分配给每个未知值。这样可以绘制未知值。

省略的值仅用于稀疏ARFF文件。如果数据集稀疏(即大多数值为0),这些文件很有用。不是在文件中写入所有0,而只需要写入非零值及其对应的位置。在这种情况下,所有未表示的值因此假定为0。

基本上;如果您不知道某个值,则指定未知值?