在模型训练期间PC重新启动

时间:2019-03-15 13:35:53

标签: tensorflow keras

我正在ubuntu 18.04的GPU(GTX 1080)上使用keras训练基本的神经网络。我使用的是Mobilenet基本模型,该模型具有一些额外的层和一个数据生成器来训练我的网络。

当我开始训练时,很快,在我的第一个或第二个时期,我的电脑突然重启,没有任何错误。我已经读到这可能是PSU降级,并且PSU无法处理突发的电源需求。

我计算出我的电脑的最大功率要求应该不超过370瓦,并且我有700瓦的PSU(Kolink 80 plus)。整台PC大约是在一年前建造的,这是我第一次使用GPU训练网络。

我也尝试使用sudo nvidia-smi -pl 150限制GPU的电源,但是仍然发生重新启动。

除了PSU降级之外,还有其他什么可以触发随机重启吗?

1 个答案:

答案 0 :(得分:1)

Nvidia 1080的最大功耗不可能只有370瓦,但是无论如何,这似乎是足够的PSU。你基准温度了吗?