标签: weka arff
我正在使用weka工具进行数据挖掘项目。我有一个包含2750个用户的csv文件,以及他们对他们喜欢哪种数据挖掘/机器学习工具的回答。该文件包括3列。用户ID,它是一个整数,一个整数,表示他们回答了多少工具,然后用;分隔这些工具的名称。我必须创建一个arff文件,其属性为用户ID和提到的工具,如果用户提到该工具,则二进制矢量取值为1,否则为0。提到的不同工具数量为95。除了手动操作外,还有什么想法可以实现?