我通过测试NLTK的内置电影评论语料库来学习情绪分析。我试图从正面类别中提取文件ID:
SELECT Tx_ID,SUBTRACT(MAX(Tx_Time),MIN(Tx_Time)) FROM Tx_Table GROUP BY Tx_ID HAVING count(*) > 1
但我一直收到错误:
"未找到类别"
即使from nltk.corpus import movie_reviews as mr
poslearn1 = mr.fileids(categories="pos"[667:])
似乎有效。
任何帮助将不胜感激,我已经坚持了一段时间了。
答案 0 :(得分:2)
以下行没有任何意义
poslearn1 = mr.fileids(categories="pos"[:667])
它完全等同于写作
poslearn1 = mr.fileids(categories="pos")
您可以尝试以下
categories="pos"[:667]
print(categories) # prints pos
这一行
categories="pos"[667:]
除了空字符串外什么也找不到。它试图从索引667
开始生成一个不存在的“pos”子字符串。