Weka与缺失的价值观

时间:2012-03-22 16:30:03

标签: weka arff

我有一个关于weka这个人的问题:

  

大家好:

     

我对WEKA感到很奇怪。

     

我准备了一个包含大量缺失值的CSV文件。一   这个文件中缺少的值是基本的,对之间没有任何值   逗号,即random_value1,,random_value2。这是一个例子   格式。你可以看到有一对逗号,它们之间只是   什么都不是white_space,它应该表明缺少   数据的价值。

     

奇怪的是,当我将这个CSV读入WEKA时,WEKA会分配所有   缺少问号的值,即'?'。这正是WEKA的方式   表达它。

     

然后当我进行测试分析时,WEKA开始研究这些问题   '?'作为一些有用的信息。它只是缺少价值,可以   WEKA请跳过它?

     

这些问题变得非常浪费。分析结果如果是   失踪,然后失去价值,失踪失踪,失踪   相关缺失。

     

WEKA能否将缺失值视为缺失值,而不是某种问题   分数?或者,我可以告诉WEKA,对于所有'?',将它们视为缺失   值?

     

谢谢你们

他使用这个解决方案解决了他的问题:

我找到了告诉WEKA失踪的方法。只需使用ASCII编辑器的fine_and_replace函数,替换所有'?'至 ?。

>

但我不知道如何下载ASCII编辑器并使用它,任何人都可以告诉我????

2 个答案:

答案 0 :(得分:2)

我建议你在windows中使用notepad2或notepad ++。

答案 1 :(得分:0)

您不必处理缺失值。不同的算法对缺失值的工作方式不同所以,不用担心,它将以应有的方式处理。