我尝试了这个,但是出现一个错误,提示未定义语料库
将熊猫作为pd导入
import os
import csv
import nltk
import nltk.corpus
from nltk import sent_tokenize
from nltk.tokenize import word_tokenize
import nltk.corpus
from nltk.corpus import stopwords
from sklearn.feature_extraction.text import CountVectorizer
vect=CountVectorizer()
import nltk
token_list=[]
for sentence in Corpus:
token_list.append(nltk.word_tokenize(sentence))
print(token_list[0])
print(token_list[1])
出现此错误,我该如何解决?
NameError Traceback (most recent call last)
<ipython-input-15-de7f807821cb> in <module>
1 import nltk
2 token_list=[]
----> 3 for sentence in Corpus:
4 token_list.append(nltk.word_tokenize(sentence))
5
NameError: name 'Corpus' is not defined
答案 0 :(得分:4)
您导入的是nltk.corpus
,而不是corpus
。因此,您必须在代码中的任何地方使用nltk.corpus
。直接使用corpus
的常见方法是
from nltk import corpus
请注意,这是小写字母。如果您真的希望它是大写的:
import nltk.corpus as Corpus
答案 1 :(得分:1)
您尝试更改语料库-> nltk.corpus
for sentence in nltk.corpus:
如果您只是“导入”而不是“从模块导入*”,则模块名称必须在python中作为前缀。