标签: deeplearning4j
Word2vec是一个很棒的工具,是deeplearning4j。我设法在tutorial之后为语料库创建了一个向量。
Word2vec
现在的问题是如何使用新句子更新模型,而无需从头再次重建。
对此有一些想法,这种方法有帮助吗?
public void trainSentence(List<VocabWord> sentence){}
会更新模型吗?如果是,如何准备要发送给这种方法的句子?
答案 0 :(得分:2)
是和否。在文档here中,它提到:
添加模型序列化/反序列化后权重更新。 也就是说,你可以用200GB的新文本更新模型状态 致电loadFullModel,添加TokenizerFactory和 SentenceIterator,并在已恢复的模型上调用fit()。
loadFullModel
TokenizerFactory
SentenceIterator
fit()
这意味着可以使用新的语料库重新训练和更新模型权重。但是词汇中不会添加任何新单词。
检查代码和Javadoc here。