Question

我尝试了这个，但是出现一个错误，提示未定义语料库

将熊猫作为pd导入

import os
import csv
import nltk
import nltk.corpus
from nltk import sent_tokenize
from nltk.tokenize import word_tokenize
import nltk.corpus
from nltk.corpus import stopwords
from sklearn.feature_extraction.text import CountVectorizer
vect=CountVectorizer()

import nltk
token_list=[]
for sentence in Corpus:
    token_list.append(nltk.word_tokenize(sentence))

print(token_list[0])
print(token_list[1])

出现此错误，我该如何解决？

NameError                                 Traceback (most recent call last)
<ipython-input-15-de7f807821cb> in <module>
      1 import nltk
      2 token_list=[]
----> 3 for sentence in Corpus:
      4     token_list.append(nltk.word_tokenize(sentence))
      5 

NameError: name 'Corpus' is not defined

Answer 1

您导入的是nltk.corpus，而不是corpus。因此，您必须在代码中的任何地方使用nltk.corpus。直接使用corpus的常见方法是

from nltk import corpus

请注意，这是小写字母。如果您真的希望它是大写的：

import nltk.corpus as Corpus

Answer 2

您尝试更改语料库-> nltk.corpus

for sentence in nltk.corpus:

如果您只是“导入”而不是“从模块导入*”，则模块名称必须在python中作为前缀。

如何解决此错误？未定义“ Corpus”

2 个答案: