通过公共属性将ARFF文件合并在一起

时间:2016-02-25 11:23:57

标签: java merge weka data-processing arff

我目前有两个单独的ARFF文件用于Java程序,我使用WEKAs机器学习算法编写。这两个文件的格式为:

@attribute movieID numeric
@attribute title {whole, host, of, movie, titles}
@attribute genres {whole, list, of, genres}

@attribute movieID numeric
@attribute tags {very, long, list, of, possible, tags}
@attribute timestamp numeric

在理想的世界里,我期待着加入'这两个文件由他们的movieID's所以相关的标签将分配给电影但是我不确定这是否可能?经过一次公平的旧搜索后,我不确定如何进行此操作或一般来创建单个数据集,以便与该计划的其余部分一起使用研究关联规则。任何帮助将不胜感激

1 个答案:

答案 0 :(得分:0)

R中的

外来包能够读写ARFF文件。

  • 您可以先在R中的两个不同数据框中读取这两个文件(请参阅 here)。

  • 然后使用“merge”命令以您需要的任何方式连接数据框(请参阅 here)。

  • 最后,您可以轻松地在新的ARFF文件中编写新数据框(请参阅 here)。