我有一组文件,每个文件都包含一个唯一标识符。我以编程方式使用Weka,并创建了一个训练arff文件。 arff文件中的每个实例都对应于我从每个文件中提取的一组属性,因此每个文件有一个实例。如何将每个文件的标识符与arff文件中的相应实例链接。非常感谢你提前。
答案 0 :(得分:4)
您可以通过创建额外属性as described here来将标识符与每个实例相关联。
因此,在您的情况下,您将创建一个字符串属性并将此属性添加到每个实例。在训练和测试分类器时,您需要删除标识符,这可以使用Remove Type Filter轻松完成,{{3}}默认情况下会删除字符串类型;删除筛选器也可以,您可以在其中指定属性索引。
如果使用命令行运行Weka,则可以使用-p选项输出预测和属性(即使是已过滤的属性);看到第一个链接的底部。
答案 1 :(得分:1)
如果我没有误解,您想要将两个或更多个arff文件链接在一起。
假设我们有两个名为file1.arff
和file2.aff
的arff文件。
您可以通过命令行使用以下代码:
java weka.core.Instances append file1.arff file2.arff
干杯