Question

我通过测试NLTK的内置电影评论语料库来学习情绪分析。我试图从正面类别中提取文件ID：

SELECT Tx_ID,SUBTRACT(MAX(Tx_Time),MIN(Tx_Time)) FROM Tx_Table GROUP BY Tx_ID HAVING count(*) > 1

但我一直收到错误：

＆＃34;未找到类别＆＃34;

即使from nltk.corpus import movie_reviews as mr poslearn1 = mr.fileids(categories="pos"[667:])似乎有效。

任何帮助将不胜感激，我已经坚持了一段时间了。

Answer 1

以下行没有任何意义

poslearn1 = mr.fileids(categories="pos"[:667])

它完全等同于写作

poslearn1 = mr.fileids(categories="pos")

您可以尝试以下

categories="pos"[:667]
print(categories) # prints pos

这一行

categories="pos"[667:]

除了空字符串外什么也找不到。它试图从索引667开始生成一个不存在的“pos”子字符串。