使用NLTK3错误的文本分类?

时间:2014-12-19 19:46:22

标签: python text classification nltk

我正在使用NLTK3进行阿拉伯语文本分类..我收到以下错误,请你帮我弄清楚错误

"calssifier =NaiveBayesClassifier.train(train_set)
  File "/usr/local/lib/python2.7/dist-packages/nltk/classify/naivebayes.py", line 194, in train
    for fname, fval in featureset.items():
AttributeError: 'unicode' object has no attribute 'items'"

由于

2 个答案:

答案 0 :(得分:1)

train_set 是一个字符串,应该是一个字典。

答案 1 :(得分:0)

错误消息

 'unicode' object has no attribute 'items'"

表示train_setunicode,应该是类似dict的 使用items方法的对象。

要说更多内容,您需要发布minimal example来消除错误。

有关使用

的示例,请参阅chapter 6 of the NLTK book
classifier = nltk.NaiveBayesClassifier.train(train_set)