标签: python nltk python-packaging
我使用的from nltk.tokenize import word_tokenize需要punkt。在代码中,您可以使用nltk.download('punkt')下载它。
from nltk.tokenize import word_tokenize
punkt
nltk.download('punkt')
我确实有nltk的要求,但是没有目标nltk[punkt]。是否有另一种方法可以在我的setup.py中将此设置作为要求?建议的处理nltk数据依赖性的方法是什么?
nltk
nltk[punkt]
setup.py
当前,我只是在函数内调用nltk.download('punkt') ...因此,每次调用此函数都会使其速度变慢。