有没有办法自动将NA值转换为?在weka中加载.csv文件? 或者我们是否必须使用其他一些脚本/程序来替换它们?或装入weka之前的空白区域。
欢迎任何帮助或建议。感谢
答案 0 :(得分:2)
不幸的是,我不相信Weka有办法进行这种转换。这是因为Weka的原生格式是.arff文件。 在.arff文件中,缺失值用“?”表示。当加载.csv文件时,它期望缺失值也用“?”表示。
根据您使用Weka的方法,我建议:
对于Weka GUI,在简单文本编辑器中使用“查找和替换”将“NA”更改为“?”在将.csv加载到Weka之前。
对于Weka Java API,编写一个方法来预处理“.csv”文件,然后再将其交给Weka .csv加载程序。