我有一个在inception_resnet模型上训练的人脸识别模型。
当我运行tensorflow代码以在Nvidia Jetson TX1上加载经过训练的模型时,它只输出“已杀死”。我该如何调试呢?
我该怎么办?我认为这是因为记忆问题!
答案 0 :(得分:2)
根据this issue'杀死'在jetson意味着它耗尽了内存。可能无法在TX1上运行inception_resnet模型。
答案 1 :(得分:0)
您可以尝试将batch_size数字从32减少到16,这将减少内存消耗并增加训练时间。
答案 2 :(得分:0)
最后我找到了答案!
如果未设置GPU内存的最大比例,它将分配几乎全部可用内存。我的问题是GPU内存不足。
您可以通过会话配置。
我在tf.GPUOptions中将 per_process_gpu_memory_fraction配置设置为0.8,问题已解决。
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.8)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))