Question

使用以下方式训练新模型时

java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.prop

假设myPropertiesFile.prop中指定的模型已存在。是从头开始训练的新模型还是从现有参数开始训练？我能控制在这种情况下做了什么吗？

某些背景信息：

我想首先在一个非常大的标记数据上训练标记器，然后继续训练一个更小的准确数据集（一个所谓的warm start）

Answer 1

它将从头开始构建一个新模型。据我所知，没有功能可以在一个数据集上训练模型，然后继续训练不同的数据集。您可以修改代码以获取初始功能和权重，然后从那里开始训练，但它没有设置为轻松完成。