Arff文件 - 未在标头中声明的标称值。

时间:2013-03-15 20:06:53

标签: weka arff

我正在使用Java程序生成.arff文件。该文件有大约600个属性。

我无法在Weka Explorer中打开该文件。 它说:"标题值未在标题中声明,读取令牌[0],第626行。"

这是第一个属性行:@attribute vantuono numeric
以下是第626行的前几个字符:0,0,0,0,1,0,0,0,0,1,0,1 ......

为什么WEKA无法解析' 0'作为数值?

有趣的是,这只发生在这个文件中。我有其他文件,数字属性接受' 0'为了一个价值。

4 个答案:

答案 0 :(得分:2)

您确定您的声明是否正确? WEKA FAQ说:

  

标题值未在标题中声明,读取令牌[X],第Y行

     

如果您收到此错误消息,而不是您在ARFF标题部分中声明了名义属性,但Weka在数据中遇到了一个值(“X”)(行 Y )此特定属性未列为可能的值。   数据中出现的所有标称值必须在标题中声明。

还有bug regarding sparse ARFF files

答案 1 :(得分:0)

使用-B #noOfRecords选项增加内存以容纳所有行。

java weka.core.converters.CSVLoader filename.csv filename.arff -B 33000

答案 2 :(得分:0)

如果您收到此错误,则更有可能在数据集中(在@data行之后),您保留了已声明的HEADER(列名称)。请删除该标题行,你应该好好去。

答案 3 :(得分:0)

我遇到了同样的错误。然后我看到我的程序增加了一个撇号。当我删除撇号后,它就会起作用