我有一个关于weka这个人的问题:
大家好:
我对WEKA感到很奇怪。
我准备了一个包含大量缺失值的CSV文件。一 这个文件中缺少的值是基本的,对之间没有任何值 逗号,即random_value1,,random_value2。这是一个例子 格式。你可以看到有一对逗号,它们之间只是 什么都不是white_space,它应该表明缺少 数据的价值。
奇怪的是,当我将这个CSV读入WEKA时,WEKA会分配所有 缺少问号的值,即'?'。这正是WEKA的方式 表达它。
然后当我进行测试分析时,WEKA开始研究这些问题 '?'作为一些有用的信息。它只是缺少价值,可以 WEKA请跳过它?
这些问题变得非常浪费。分析结果如果是 失踪,然后失去价值,失踪失踪,失踪 相关缺失。
WEKA能否将缺失值视为缺失值,而不是某种问题 分数?或者,我可以告诉WEKA,对于所有'?',将它们视为缺失 值?
谢谢你们
他使用这个解决方案解决了他的问题:
我找到了告诉WEKA失踪的方法。只需使用ASCII编辑器的fine_and_replace函数,替换所有'?'至 ?。
>
但我不知道如何下载ASCII编辑器并使用它,任何人都可以告诉我????
答案 0 :(得分:2)
我建议你在windows中使用notepad2或notepad ++。
答案 1 :(得分:0)
您不必处理缺失值。不同的算法对缺失值的工作方式不同所以,不用担心,它将以应有的方式处理。