我目前有两个单独的ARFF文件用于Java程序,我使用WEKAs机器学习算法编写。这两个文件的格式为:
@attribute movieID numeric
@attribute title {whole, host, of, movie, titles}
@attribute genres {whole, list, of, genres}
和
@attribute movieID numeric
@attribute tags {very, long, list, of, possible, tags}
@attribute timestamp numeric
在理想的世界里,我期待着加入'这两个文件由他们的movieID's所以相关的标签将分配给电影但是我不确定这是否可能?经过一次公平的旧搜索后,我不确定如何进行此操作或一般来创建单个数据集,以便与该计划的其余部分一起使用研究关联规则。任何帮助将不胜感激