Question

Word2vec是一个很棒的工具，是deeplearning4j。我设法在tutorial之后为语料库创建了一个向量。

现在的问题是如何使用新句子更新模型，而无需从头再次重建。

对此有一些想法，这种方法有帮助吗？

public void trainSentence(List<VocabWord> sentence){}

会更新模型吗？如果是，如何准备要发送给这种方法的句子？

Answer 1

是和否。在文档here中，它提到：

添加模型序列化/反序列化后权重更新。也就是说，你可以用200GB的新文本更新模型状态致电loadFullModel，添加TokenizerFactory和 SentenceIterator，并在已恢复的模型上调用fit()。

这意味着可以使用新的语料库重新训练和更新模型权重。但是词汇中不会添加任何新单词。

检查代码和Javadoc here。