AWS Deep Learning AMI实例上的培训模型-被警告“杀死”

时间:2018-08-13 11:03:58

标签: amazon-web-services tensorflow keras gpu

我正在尝试在我自己的Amazon Deep Learning AMI数据集上训练初始ResNetV2模型

当我尝试在本地机器上训练时,训练照常开始,但是当我尝试在AWS实例上训练时,训练被杀死了。

首先,我尝试使用MXNET后端进行培训。它给出了以下错误:

enter image description here

注意它被杀死了。

所以在

group by

我试图将图像数据格式设置为channels_first:

nano ~/.keras/keras.json

然后我得到了错误:

{
    "image_data_format": "channels_first", 
    "backend": "mxnet"
}

然后我尝试切换到tensorflow后端以查看其运行情况,因为我可能对此过程的工作方式有些误解。但是当我切换到tensorflow后端并开始训练时,出现了以下错误:

enter image description here

您可以看到它再次被杀死。 我不确定下一步该怎么做。一些帮助会很棒。

P.S对不起,屏幕截图。您将不得不放大一点以获得更好的视图。

1 个答案:

答案 0 :(得分:1)

t2实例类型主要不支持深度学习AMI。它应该适用于大多数良好的cpu实例类型(例如C4,C5)或GPU实例类型(G3,P2和P3)以及许多其他实例类型。