使用以下方式训练新模型时
java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.prop
假设myPropertiesFile.prop
中指定的模型已存在。是从头开始训练的新模型还是从现有参数开始训练?我能控制在这种情况下做了什么吗?
某些背景信息:
我想首先在一个非常大的标记数据上训练标记器,然后继续训练一个更小的准确数据集(一个所谓的warm start
)
答案 0 :(得分:1)
它将从头开始构建一个新模型。据我所知,没有功能可以在一个数据集上训练模型,然后继续训练不同的数据集。您可以修改代码以获取初始功能和权重,然后从那里开始训练,但它没有设置为轻松完成。