Tensorflow,Horovod和NVLINK NotFoundError

时间:2019-03-09 20:39:40

标签: python tensorflow nvlink horovod

我正在尝试使用 uber的horovod库运行在GPU上运行的tensorflow神经网络。同时,我尝试运行一个测量脚本来测量多个GPU之间的 nvlinks 。 las,每当我运行文件时,都会出现以下错误:

  

tensorflow.python.framework.errors_impl.NotFoundError:/home/pat/.virtualenvs/venv/lib/python3.6/site-packages/horovod   /tensorflow/mpi_lib.cpython-36m-x86_64-linux-gnu.so:未定义的符号:_ZN10tensorflow14kernel_factory17OpKernelRegist rar12InitInternalEPKNS_9KernelDefEN4absl11string_viewESt10unique_ptrINS0_15OpKernelFactory

有人知道如何解决此问题吗?

谢谢。

1 个答案:

答案 0 :(得分:0)

请查看回购中提出的这个问题:

https://github.com/horovod/horovod/issues/656