属性名称在Weka 3.8中不是唯一的

时间:2017-03-08 09:30:52

标签: cluster-analysis weka

我无法导入CSV文件。我收到以下错误:File" filename.csv"未被识别为CSV数据文件'文件。原因:属性名称不是唯一的!原因:' 2' ' 1'

有谁能告诉我如何解决这些问题?我在Windows 10 64位笔记本电脑上使用Weka 3.8。

提前致谢。

3 个答案:

答案 0 :(得分:0)

WEKA将假设第一行数据是列的名称,但是我查看的NSL-KDDCup数据集的版本 github 没有列标题。由于第一行有一些重复的值,您会收到此错误消息。我会建议两种解决方案。

  1. 上面提到的github有一个包含数据的weka友好的arff文件。

  2. 将列标题添加到csv文件中。列标题应该是什么?它们列在arff文件中。 : - )

答案 1 :(得分:0)

当属性名称相同时,在Excel工作表的多个列中发生。只需重命名相同的列名。它应该是独一无二的。这对我有用

答案 2 :(得分:0)

只需确保具有相对于属性值唯一的列名。当我应用StringtoWordVector并获取与列名同名的字符串时,这种情况对我来说就会发生。只要给一个好的列名:)