标签: gensim word2vec
我使用Gensim训练大小为4的句子,训练数据集中有1192个独特单词。模型len(model.vocab)中的单词数量是141,但这没有意义。看到这个有什么理由吗?我如何改变他们的模型以获得培训中每个单词的关键? model = Word2Vec(windows,min_count = 1)