是否可以通过同时推断所有文档来保留要推断的每个文档的doc2vec模式的随机状态?

时间:2019-03-14 18:30:44

标签: gensim word2vec doc2vec

是否可以使用Gensim Doc2Vec同时推断多个文档以保留模型的随机状态?

函数infer_vector定义为

infer_vector(doc_words, alpha=None, min_alpha=None, epochs=None, steps=None)¶

其中doc_words(str的列表)–将为其推断矢量表示的文档。而且我找不到其他选择来同时推断多个文档。

1 个答案:

答案 0 :(得分:1)

当前没有选项可以一次推断多个文档。这是.gm-style > div > div > div > div > div { opacity: 0.6; } (收集在open issue中的许多愿望清单改进之一,但是尚无任何工作正在进行或有针对性的发布。

我不确定“保留模型的随机状态”是什么意思。我看到的批处理的主要动机是用户方便或通过多线程提高性能。

如果您真正想要的是确定性推断,请参阅answer in the Gensim FAQ which explains why deterministic Doc2Vec inference isn't necessarily a good idea。 (如果您有充分的理由不这样做的话,它也提供了指向该问题的链接,其中包含一些有关如何解决该问题的想法。)