arff文件中的问号

时间:2013-12-04 19:31:11

标签: weka arff

我想知道我可以将arff文件中的问号替换为“0”吗?有什么区别吗?下面是一个例子:

  

@data

     
    

4.4,...,1.5,...,虹膜setosa

  

1 个答案:

答案 0 :(得分:3)

存在巨大的差异。问号会告诉您正在使用的任何算法缺少值。用零替换它表示该值实际上为零。

某些方法能够处理缺失值。这些方法可以用该属性的其他值的平均值替换缺失值,它们可以完全忽略该实例,或者它们可以执行其他操作。但是,如果您告诉方法该值为零(实际上并非如此),您将指示丢失值发生的情况,则假定它们为零。

link提供了“.arff”文件的详细说明,以及它们的预期内容。