我正在尝试使用ResNet架构运行pyTorch管道。
Everithing可以在Mac笔记本电脑上使用pyTorch官方Docker在CPU上运行。
一切都很好,直到出现此错误:
Batch 23/51
Batch 24/51
Traceback (most recent call last): File "model.py", line 251, in <module>
loss.backward()
File "/opt/conda/lib/python3.6/site-packages/torch/tensor.py", line 93, in backward
torch.autograd.backward(self, gradient, retain_graph, create_graph)
File "/opt/conda/lib/python3.6/site-packages/torch/autograd/__init__.py", line 89, in backward
allow_unreachable=True) # allow_unreachable flag
File "/opt/conda/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 178, in handler
_error_if_any_worker_fails()
RuntimeError: DataLoader worker (pid 397) is killed by signal: Killed.
在第一个二十四期之前,它似乎可以正常工作。
数据集使用标准库中的TensorDataset。
谁能给我提示发生了什么事?
多次尝试会给出不同的批号(即使没有随机播放),并且笔记本电脑的资源在整个运行过程中看起来都很好。
如果我尝试使用workers=0
作为装载程序,我会得到:
Batch 24/51
Batch 25/51
Batch 26/51
Batch 27/51
Batch 28/51
Killed
非常感谢您。