我正在使用使用tensor-flow编写的 NeuroNER 来培训定制的实体识别(NER)模型。我能够训练模型及其表现良好但是当我在新的观察中重新训练时,它会显示不正确的结果,但它会纠正它们,但是影响/忘记之前的一些观察,它会显示正确的结果。
我想要在线重新培训。我尝试使用stanfordNLP,Spacy和现在的tensor-flow.please建议一种更好的方法来实现预期的目标。
谢谢
答案 0 :(得分:1)
我认为这个问题背后存在误解。训练模型时,您需要调整一组参数,有时需要数百万个参数。然后,您的模型将学习如何拟合这些数据。
神经网络的事情是他们可能会忘记。听起来很糟糕,但实际上它真的很强大:它学会忘记什么是无用的。
也就是说,如果你重新训练,你应该: - 只运行几个时代,否则模型会过度拟合新数据集,从而忘记其他一切 - 学习更大的数据集,即过去+新数据,将确保不遗漏任何东西 - 也许使用更大的设置(隐藏图层大小或图层数量),因为您无法无限期地希望通过相同的设置了解更多信息。
我不是在线培训的专家,但这不是你可以毫不费力地期待的事情。实际上在实践中很难做到。当你"只是"它远没有成为默认行为。继续训练。
希望它有所帮助。