deeplearning4j:在线Word2Vec培训

时间:2016-05-02 18:37:16

标签: deeplearning4j

Word2vec是一个很棒的工具,是deeplearning4j。我设法在tutorial之后为语料库创建了一个向量。

现在的问题是如何使用新句子更新模型,而无需从头再次重建。

对此有一些想法,这种方法有帮助吗?

public void trainSentence(List<VocabWord> sentence){}

会更新模型吗?如果是,如何准备要发送给这种方法的句子?

1 个答案:

答案 0 :(得分:2)

是和否。在文档here中,它提到:

  

添加模型序列化/反序列化后权重更新。   也就是说,你可以用200GB的新文本更新模型状态   致电loadFullModel,添加TokenizerFactory和   SentenceIterator,并在已恢复的模型上调用fit()

这意味着可以使用新的语料库重新训练和更新模型权重。但是词汇中不会添加任何新单词。

检查代码和Javadoc here