我正在尝试使用Python nltk对字符串中的单词进行标记,我需要导入以下模块:
from nltk import WhitespaceTokenizer
from nltk import WordPunctTokenizer
但它无法导入这些模块:
>>ImportError: No module named nltk
我可以import nltk
和dir(nltk)
向我展示两个模块的存在:WhitespaceTokenizer,WordPunctTokenizer
有没有人遇到这个问题?我使用的是Python 2.6.1
答案 0 :(得分:0)
安装nltk:
pip install nltk
或者您可以从此处下载预编译版本: http://www.lfd.uci.edu/~gohlke/pythonlibs/#nltk
使用.whl文件安装
pip install nltk-3.2.2-py2.py3-none-any.whl
您的导入声明应为:
from nltk.tokenize import WhitespaceTokenizer, WordPunctTokenizer
答案 1 :(得分:-1)
以下代码是否适合您?
import nltk
WhitespaceTokenizer = nltk.WhitespaceTokenizer
WordPunctTokenizer = nltk.WordPunctTokenizer
您使用的是nltk
的哪个版本?尝试更新到最新版本。您的代码适用于我的配置(带有nltk 2.0.1rc4的Python 2.7)。