Tensorflow:如何优化GCloud-ML的预测?

时间:2017-08-22 18:14:17

标签: tensorflow gcloud google-cloud-ml

我在GCloud-ML上发布了一个模型,它工作正常。我可以做在线预测并获得正确的结果。我的问题是表现。每个预测(推断)大约需要3.5秒,这对我的情况不利。我正在使用自动缩放,我的桶是US-Central。我的图像大约100Kb,我在巴西(在GCloud控制台中,我可以看到延迟 - > 1.5秒)。 我已经尝试了optimazed_for_inference.py,但它不起作用(我无法从优化图中生成saved_model。有可能吗?)。

我需要至少在2秒内得到结果。我的疑问是:有可能这样做吗? 或使用gcloud-ml预测以3/4秒获得结果是否正常?

谢谢!任何想法都很好!如果您需要更多信息来帮助我,请添加评论! 再次感谢!

0 个答案:

没有答案