我想知道我可以将arff文件中的问号替换为“0”吗?有什么区别吗?下面是一个例子:
@data
4.4,...,1.5,...,虹膜setosa
答案 0 :(得分:3)
存在巨大的差异。问号会告诉您正在使用的任何算法缺少值。用零替换它表示该值实际上为零。
某些方法能够处理缺失值。这些方法可以用该属性的其他值的平均值替换缺失值,它们可以完全忽略该实例,或者它们可以执行其他操作。但是,如果您告诉方法该值为零(实际上并非如此),您将指示丢失值发生的情况,则假定它们为零。
此link提供了“.arff”文件的详细说明,以及它们的预期内容。