是否可以使用Gensim Doc2Vec同时推断多个文档以保留模型的随机状态?
函数infer_vector定义为
infer_vector(doc_words, alpha=None, min_alpha=None, epochs=None, steps=None)¶
其中doc_words(str的列表)–将为其推断矢量表示的文档。而且我找不到其他选择来同时推断多个文档。
答案 0 :(得分:1)
当前没有选项可以一次推断多个文档。这是.gm-style > div > div > div > div > div {
opacity: 0.6;
}
(收集在open issue中的许多愿望清单改进之一,但是尚无任何工作正在进行或有针对性的发布。
我不确定“保留模型的随机状态”是什么意思。我看到的批处理的主要动机是用户方便或通过多线程提高性能。
如果您真正想要的是确定性推断,请参阅answer in the Gensim FAQ which explains why deterministic Doc2Vec
inference isn't necessarily a good idea。 (如果您有充分的理由不这样做的话,它也提供了指向该问题的链接,其中包含一些有关如何解决该问题的想法。)