gensim中的词汇量远低于训练数据中的词汇量

时间:2016-06-20 20:04:51

标签: gensim word2vec

我使用Gensim训练大小为4的句子,训练数据集中有1192个独特单词。模型len(model.vocab)中的单词数量是141,但这没有意义。看到这个有什么理由吗?我如何改变他们的模型以获得培训中每个单词的关键? model = Word2Vec(windows,min_count = 1)

0 个答案:

没有答案