当我尝试以下代码时
python -c "import nltk; nltk.download('punkt');
nltk.download('averaged_perceptron_tagger');
nltk.download('maxent_treebank_pos_tagger');
nltk.download('wordnet')"
控制台说
[nltk_data] Error loading punkt: HTTP Error 405: Not allowed.
[nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405:
[nltk_data] Not allowed.
[nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405:
[nltk_data] Not allowed.
[nltk_data] Error loading wordnet: HTTP Error 405: Not allowed.
答案 0 :(得分:11)
这是由Github原始文件链接的老化引起的。
同时,一个临时解决方案是手动下载文件:
PATH_TO_NLTK_DATA=/home/username/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA
我们正在努力寻找数据和模型下载的替代方案。
同时, @everyone请帮助检查您的脚本并确保您没有超载数据下载!提前谢谢!!
请查看https://github.com/nltk/nltk/issues/1787以获取有关此问题的最新动态。
答案 1 :(得分:0)
对于MacOSX - 对上述答案的小修改:
PATH_TO_NLTK_DATA=~/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA
请注意,这是一个很大的下载(~700MB)。