如何在arff文件中表示n-gram特征?

时间:2017-01-26 09:54:08

标签: machine-learning nlp weka n-gram arff

我一直在网上搜索这个问题,但我找不到解决方案。 问题是: 我首先在java中使用Weka API来提取n-gram特性,其中一个我可以举例说明是

"not good"

问题从这里开始: arff文件的标题是这样的:

@relation words
@attribute {0,1} not good

但是在创建arff文件之后,当我想处理文件时,会出现异常,这意味着arff文件的结构不正确。

1 个答案:

答案 0 :(得分:1)

您没有正确的属性名称和可能值的顺序。此外,必须引用包含空格的属性名称。下面的示例.arff文件应该加载。

http://www.cs.waikato.ac.nz/ml/weka/arff.html

@relation words

@attribute 'not good' {0,1}

@data

0
1
0
1