我正在尝试在Gensim
word2vec
上训练NLTK
库的Brown Corpus
,但是在设置语料库的路径时遇到了问题
代码
from gensim.models import word2vec
sentences = word2vec.BrownCorpus('/nltk_data/corpora/brown')
model = word2vec.Word2Vec(sentences, min_count=1)
错误
FileNotFoundError:[错误2]没有这样的文件或目录:'/ nltk_data / corpora / brown'
我已经检查过,上面的路径中存在布朗语料库数据。
我知道还有另一种在NLTK Brown Corpus上训练Gensim word2vec的方法,但是我想知道为什么上述方法不起作用
from gensim.models import Word2Vec
from nltk.corpus import brown
sentences = brown.sents()
model = Word2Vec(sentences, min_count=1)
随意发表任何想法