Tensorflow对象检测使我的系统超载

时间:2019-01-13 11:42:18

标签: python tensorflow gpu object-detection

从昨天开始,我已经完成了训练一个模特的第一次尝试:

python object_detection/legacy/train.py --train_dir=CP --pipeline_config_path=faster_rcnn_inception_v2_coco.config

几次(10或20秒)后,我再也无法用口或键盘输入东西。 GPU(nvidia-smi)的更新被冻结。 几分钟后,我进行了一次重置,并验证了CP的内容。它不再是空的。 我看到的是,硬盘驱动器一直在工作。

我第二次做了同样的事情,但是让过程继续到早晨。 CP目录已更新(至model.ckpt-491)。

现在用几个词来描述我的配置: 处理器:i5 内存:8 GB 操作系统:Ubuntu 18.04 GPU 1:GT 730用于可视化 GPU 2:GTX 1060

ncvv:V9.0 和nvidia-smi给:

  

+ ---------------------------------------------- ------------------------------- +   | NVIDIA-SMI 390.87驱动程序版本:390.87 |   | ------------------------------- + ----------------- ----- + ---------------------- +   | GPU名称持久性-M |总线编号Disp.A |挥发性不佳。 ECC |   |风扇温度性能:用法/上限|内存使用| GPU实用计算M。   | ============================== + ================= ===== + ==================== |   | 0 GeForce GT 730关闭| 00000000:01:00.0 N / A | N / A |   |不适用34C P0不适用/不适用| 703MiB / 2001MiB | N / A默认|   + ------------------------------- + ----------------- ----- + ---------------------- +   | 1 GeForce GTX 106 ...关闭| 00000000:06:00.0关闭| N / A |   | 0%33C P8 4W / 120W | 2MiB / 6078MiB | 0%默认|   + ------------------------------- + ----------------- ----- + ---------------------- +   + ------------------------------------------------- ---------------------------- +

最初,我安装的所有东西只能与一个GPU配合使用(GT 730,因为我目前没有第二个)。 昨天我收到了新的视频卡,但没有做任何事情,它被nvidia-smi识别,并被Tensorflow直接使用。无需任何其他修改。

现在我的问题:

  • 我没有为此新卡安装驱动程序的事实可能是这个问题(我没有将其用于可视化)?
  • 或配置文件中的某些点(我将maxsize减小到600 * 480),并且可以将batch_size减小到1以避免我的问题?

感谢您的帮助 让·玛丽(Jean-Marie)

1 个答案:

答案 0 :(得分:0)

我购买了更多的RAM(总共24 GB),这次执行速度很快。不再可能使用我的计算机。甚至我还能增加图像大小!

对于大多数人来说可能是显而易见的。但这只是在某些情况下增加了同样的问题。