gensim:在doc2vec词汇表中检索单词频率

时间:2018-01-29 18:05:36

标签: dictionary word2vec gensim doc2vec vocabulary

我刚刚在doc2vec模型词汇表中找到了this StackOverflow post关于字数的问题。我想知道是否有另一种方法可以检索单词频率,而不是

for word, vocab_obj in model.wv.vocab.items():
    print(str(word) + str(vocab_obj.count))

也许通过gensim库有一种更优雅的方式(即txt文件中的输出字和频率)?

1 个答案:

答案 0 :(得分:0)

不,内存字典(model.wv.vocab)是存储计数以供咨询的地方,显示/存储的任何其他进一步选择取决于用户自己的代码。