Gensim的Doc2Vec most_similar文档结果集是否有限制?

时间:2015-11-18 20:16:26

标签: python-3.x gensim

我一直在尝试使用doc2vec模块。我可以训练我的模型并让训练有素的模型输出给定文档的类似文档,如下所示:

import re
modelloaded=Doc2Vec.load("model_all_doc_dm_1")

st = 'long description of a document as string'
doc = re.sub('[^a-zA-Z]', ' ', st).lower().split() 

new_doc_vec = modelloaded.infer_vector(doc)

modelloaded.docvecs.most_similar([new_doc_vec])

这很好用,给了我10个结果。有没有办法获得超过10个结果或是限制?

1 个答案:

答案 0 :(得分:3)

我找到了它:

modelloaded.docvecs.most_similar([new_doc_vec], topn=N)

topn=N句柄可用于获得10个以上的结果。