我是GPU相关模型训练的新手。 我有配备6GB GPU的Tesla C2075,并使用keras CuDNNLSTM进行了更快的培训。 我已经使用cudnn = 7.0.5,tensorflow-gpu == 1.12.0并使用ubuntu 16.04安装了cuda-9。 对于Tesla C2075,GPU模型与cuda-9兼容吗? 我已经检查了https://developer.nvidia.com/cuda-gpus链接,他们提到特斯拉C2075在计算上与2.0兼容。什么是计算兼容的?
在运行模型张量流日志时,
tensorflow/core/common_runtime/gpu/gpu_device.cc:1482] Ignoring visible gpu device (device: 0, name: Tesla C2075, pci bus id: 0000:03:00.0, compute capability: 2.0) with Cuda compute capability 2.0. The minimum required Cuda capability is 3.5.
而我在使用model.fit(...)时也会出错,
InvalidArgumentError (see above for traceback): No OpKernel was registered to support Op 'CudnnRNN' with these attrs. Registered devices: [CPU,XLA_CPU,XLA_GPU], Registered kernels:
device='GPU'; T in [DT_DOUBLE]
device='GPU'; T in [DT_FLOAT]
device='GPU'; T in [DT_HALF]
[[node bidirectional_1/CudnnRNN (defined at /usr/local/lib/python3.5/dist-packages/tensorflow/contrib/cudnn_rnn/python/ops/cudnn_rnn_ops.py:922) = CudnnRNN[T=DT_FLOAT, direction="unidirectional", dropout=0, input_mode="linear_input", is_training=true, rnn_mode="lstm", seed=87654321, seed2=0](bidirectional_1/transpose, bidirectional_1/ExpandDims_1, bidirectional_1/ExpandDims_2, bidirectional_1/concat)]]
谢谢
答案 0 :(得分:1)
CUDA计算功能以某种方式与GPU的体系结构和硬件功能相关,wikipedia中有相当广泛的清单。
The tensoflow webpage suggests,您需要一个CC大于3.5的GPU(旧版本似乎接受3.0,但永远不会更低)。
不幸的是,这是硬件限制,更改计算能力的唯一方法是使用其他GPU。简而言之:您无法在该GPU中运行Tensorflow。