从昨天开始,我已经完成了训练一个模特的第一次尝试:
python object_detection/legacy/train.py --train_dir=CP --pipeline_config_path=faster_rcnn_inception_v2_coco.config
几次(10或20秒)后,我再也无法用口或键盘输入东西。 GPU(nvidia-smi)的更新被冻结。 几分钟后,我进行了一次重置,并验证了CP的内容。它不再是空的。 我看到的是,硬盘驱动器一直在工作。
我第二次做了同样的事情,但是让过程继续到早晨。 CP目录已更新(至model.ckpt-491)。
现在用几个词来描述我的配置: 处理器:i5 内存:8 GB 操作系统:Ubuntu 18.04 GPU 1:GT 730用于可视化 GPU 2:GTX 1060
ncvv:V9.0 和nvidia-smi给:
+ ---------------------------------------------- ------------------------------- + | NVIDIA-SMI 390.87驱动程序版本:390.87 | | ------------------------------- + ----------------- ----- + ---------------------- + | GPU名称持久性-M |总线编号Disp.A |挥发性不佳。 ECC | |风扇温度性能:用法/上限|内存使用| GPU实用计算M。 | ============================== + ================= ===== + ==================== | | 0 GeForce GT 730关闭| 00000000:01:00.0 N / A | N / A | |不适用34C P0不适用/不适用| 703MiB / 2001MiB | N / A默认| + ------------------------------- + ----------------- ----- + ---------------------- + | 1 GeForce GTX 106 ...关闭| 00000000:06:00.0关闭| N / A | | 0%33C P8 4W / 120W | 2MiB / 6078MiB | 0%默认| + ------------------------------- + ----------------- ----- + ---------------------- + + ------------------------------------------------- ---------------------------- +
最初,我安装的所有东西只能与一个GPU配合使用(GT 730,因为我目前没有第二个)。 昨天我收到了新的视频卡,但没有做任何事情,它被nvidia-smi识别,并被Tensorflow直接使用。无需任何其他修改。
现在我的问题:
感谢您的帮助 让·玛丽(Jean-Marie)
答案 0 :(得分:0)
我购买了更多的RAM(总共24 GB),这次执行速度很快。不再可能使用我的计算机。甚至我还能增加图像大小!
对于大多数人来说可能是显而易见的。但这只是在某些情况下增加了同样的问题。