Question

我有一个在inception_resnet模型上训练的人脸识别模型。

当我运行tensorflow代码以在Nvidia Jetson TX1上加载经过训练的模型时，它只输出“已杀死”。我该如何调试呢？

我该怎么办？我认为这是因为记忆问题！

Answer 1

根据this issue＆＃39;杀死＆＃39;在jetson意味着它耗尽了内存。可能无法在TX1上运行inception_resnet模型。

Answer 2

您可以尝试将batch_size数字从32减少到16，这将减少内存消耗并增加训练时间。

Answer 3

最后我找到了答案！

如果未设置GPU内存的最大比例，它将分配几乎全部可用内存。我的问题是GPU内存不足。

您可以通过会话配置。

我在tf.GPUOptions中将 per_process_gpu_memory_fraction配置设置为0.8，问题已解决。

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.8)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))