在Google Cloud上训练Keras模型的结果不同

时间:2018-06-26 15:55:57

标签: python tensorflow keras

我创建了一个脚本来训练keras神经网络,并已在我的机器上成功运行了该脚本(在训练结束时,验证准确度约为0.8)。但是,当我尝试在Google Cloud VM实例上运行完全相同的代码(对相同的数据)时,结果却大大恶化了(〜0.2验证精度)。

Git状态确认VM中的存储库是最新版本的master(与我的本地计算机相同),并且我已验证其tf和keras版本是最新的(与我的本地计算机相同)。在导入Keras之前,我还设置了numpy和tensorflow随机种子。

以前有人遇到过这样的问题吗?我对可能导致这种情况的原因不知所措...我能想到的唯一区别是,我的机器运行的是Python 3.6,而VM运行的是Python 2.7。能否说明培训结果的巨大差异?

1 个答案:

答案 0 :(得分:0)

我在tensorflow 1.10(当前的gcloud版本)中发现Keras与Estimator API之间存在交互错误,但在> = 1.11(我在本地使用的版本)中却没有发现。

不确定是否适用于您(您是否使用Keras + Estimator和tensorflow> = 1.11来表示本地变量?)

我在此处提交了错误报告:https://github.com/tensorflow/tensorflow/issues/24299