我正在尝试对一个ARFF文件进行分类,其中前15000个实例设置了所有属性,最后1000个实例缺少最后一个属性(属性设置为未知“?”)。
我想对那些丢失的数据进行分类并导出它们,以便设置缺少的属性(格式与输入相同)。
我尝试使用Weka Explorer,但我无法弄清楚如何管理我正在寻找的东西。
有人可以帮忙吗?
答案 0 :(得分:2)
如果你能分开未标记的"?"将实例放入他们自己的.arff文件中,然后您可以选择"提供的测试集"在Weka中,将此新文件作为测试集传递。然后点击"更多选项..."并检查"输出预测"这将显示以前未标记的实例的标签。训练你的分类器。然后,如果您可视化数据并右键单击图表,您可以选择将此新标记数据另存为.arff文件!