在NLTK布朗语料库上训练Gensim word2vec遇到麻烦

时间:2018-11-03 09:26:21

标签: python nltk gensim word2vec

我正在尝试在Gensim word2vec上训练NLTK库的Brown Corpus,但是在设置语料库的路径时遇到了问题

代码

from gensim.models import word2vec

sentences = word2vec.BrownCorpus('/nltk_data/corpora/brown')

model = word2vec.Word2Vec(sentences, min_count=1)

错误

  

FileNotFoundError:[错误2]没有这样的文件或目录:'/ nltk_data / corpora / brown'

我已经检查过,上面的路径中存在布朗语料库数据。

我知道还有另一种在NLTK Brown Corpus上训练Gensim word2vec的方法,但是我想知道为什么上述方法不起作用

from gensim.models import Word2Vec
from nltk.corpus import brown

sentences = brown.sents()

model = Word2Vec(sentences, min_count=1)

随意发表任何想法

0 个答案:

没有答案