TF 1.3 build与ppc64le上的CUDA-9挂起

时间:2017-08-29 12:41:55

标签: tensorflow-gpu

我正在尝试在Ubuntu ppc64le上使用CUDA-9构建TF 1.3。有了CUDA-9支持所需的所有补丁(eigen,nccl,甚至[TF的PR](https://github.com/tensorflow/tensorflow/pull/12502),我能够构建大部分TF代码,但是,它会在编译tensorflow时受到限制/核心/粒/ fft_ops.cc。 我用CUDA-8检查了TF1.3,它在ppc64le上没有任何问题。有没有人遇到过这种问题?我已经尝试过bazel 0.4.5和0.5.3以及两个版本,问题仍然存在。即使没有修补TF的PR支持CUDA-9对构建问题也没有影响。

1 个答案:

答案 0 :(得分:0)

我发现了这个问题的原因。这是由于Eigen的局部变化已经为我们的老TF(<1.3)+ CUDA-8而不是新的TF(> 1.3)和CUDA-9以及它们各自的Eigens。在Ubuntu上,问题是以挂起的形式提出而没有任何线索,而RHEL非常友好地抛出确切的错误。 谢谢, Nishidha