我有三个与特定文件关联的值。每个文件属于特定系列。我需要改进Weka中的“交叉验证”以了解是否有这三个值我能够识别家族。现在,创建我必须在Weka上打开的Csv或Arff文件的步骤是什么?我的txt有这种格式。
File_Family_1 Value1,Value2,Value3
File_Family_1 Value1,Value2,Value3
File_Family_2 Value1,Value2,Value3
File_Family_2 Value1,Value2,Value3
File_Family_3 Value1,Value2,Value3
File_Family_3 Value1,Value2,Value3
答案 0 :(得分:1)
我用Excel解决了这个问题。在第一行中,您必须编写标签,但在第一列中用逗号分隔。
Family, Attribute1, Attribute2, Attribute3
在其他行中,始终全部在第一列中并以逗号分隔,您必须编写标签值。
File_Family1, Value1, Value2, Value3
File_Family2, Value1, Value2, Value3
File_Family3, Value1, Value2, Value3
......
保存为“.Csv”后,不要担心Excel的警报。打开Weka并单击Explorer。所以使用“打开文件”并选择刚刚创建的Cv,一旦打开就进入Classify。最后单击“选择”以使用特定树。如果禁用启动按钮,则需要选择“(Nom)”属性来执行“交叉验证”。