在训练新的stanford-pos模型时重用参数

时间:2018-05-08 12:19:33

标签: stanford-nlp pos-tagger resuming-training

使用以下方式训练新模型时

java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.prop

假设myPropertiesFile.prop中指定的模型已存在。是从头开始训练的新模型还是从现有参数开始训练?我能控制在这种情况下做了什么吗?

某些背景信息:

我想首先在一个非常大的标记数据上训练标记器,然后继续训练一个更小的准确数据集(一个所谓的warm start

1 个答案:

答案 0 :(得分:1)

它将从头开始构建一个新模型。据我所知,没有功能可以在一个数据集上训练模型,然后继续训练不同的数据集。您可以修改代码以获取初始功能和权重,然后从那里开始训练,但它没有设置为轻松完成。