生产中的TensorFlow:如何重新训练模型

时间:2016-11-07 17:01:00

标签: tensorflow supervised-learning tensorflow-serving

我有一个与此相关的问题:

TensorFlow in production for real time predictions in high traffic app - how to use?

我想将TensorFlow服务设置为推理作为我们其他应用程序的服务。我看到TensorFlow服务如何帮助我做到这一点。此外,它提到continuous training pipeline,这可能与TensorFlow服务可以与受训模型的多个版本一起服务的可能性有关。但我不确定如何在获取新数据时重新训练模型。另一篇文章提到了用cron工作进行再培训的想法。但是,我不确定自动再培训是否是一个好主意。如果系统不断面对新的标记数据,您会建议采用哪种架构进行连续的再培训管道?

编辑:这是一个受监督的学习案例。问题是你会在新的数据点出现后自动重新训练你的模型,还是会在客户停机期间自动重新训练或者只是手动重新训练?

1 个答案:

答案 0 :(得分:1)

你可能想要使用某种半监督训练。该领域有相当广泛的研究。

一种原样,但有利的方法,运行良好,是使用当前最好的模型来标记新的传入数据。模型通常能够产生分数(希望是logprob)。您可以使用该分数仅训练适合的数据。

这是我们在语音识别中使用的一种方法,是一个很好的基准。