我有一台非常强大的Windows PC(运行Windows 10),它具有112GB内存,16个内核和3个Geforce RTX2070(不支持SLI等)。它正在运行CuDNN 7.5 + Tensorflor 1.13 + Python 3.7
我的问题是,每当我尝试运行Keras模型进行训练或在矩阵上进行预测时,都会遇到以下错误。一开始我以为只有同时运行一个以上的程序时才会发生这种情况,但事实并非如此,现在当我仅运行单个Keras实例时(通常-但并非总是如此),我也会遇到错误< / p>
2019-06-15 19:33:17.878911:我 tensorflow / core / common_runtime / gpu / gpu_device.cc:1115]已创建 TensorFlow设备(/ job:localhost /副本:0 /任务:0 /设备:GPU:2与 6317 MB内存)->物理GPU(设备:2,名称:GeForce RTX 2070, pci总线ID:0000:44:00.0,计算能力:7.5)2019-06-15 19:33:23.423911:我tensorflow / stream_executor / dso_loader.cc:152] 在本地成功打开CUDA库cublas64_100.dll 2019-06-15 19:33:23.744678:E tensorflow / stream_executor / cuda / cuda_blas.cc:510] 无法创建cublas句柄:CUBLAS_STATUS_ALLOC_FAILED 2019-06-15 19:33:23.748069:E tensorflow / stream_executor / cuda / cuda_blas.cc:510] 无法创建cublas句柄:CUBLAS_STATUS_ALLOC_FAILED 2019-06-15 19:33:23.751235:E tensorflow / stream_executor / cuda / cuda_blas.cc:510] 无法创建cublas句柄:CUBLAS_STATUS_ALLOC_FAILED 2019-06-15 19:33:25.267137:E tensorflow / stream_executor / cuda / cuda_dnn.cc:334] 无法创建cudnn句柄:CUDNN_STATUS_ALLOC_FAILED 2019-06-15 19:33:25.270582:E tensorflow / stream_executor / cuda / cuda_dnn.cc:334] 无法创建cudnn句柄:CUDNN_STATUS_ALLOC_FAILED异常: 无法获得卷积算法。这可能是因为cuDNN 初始化失败,因此请尝试查看警告日志消息 印在上面。 [[{{node conv2d_1 / convolution}}]] [[{{node density_3 / Sigmoid}}]]
答案 0 :(得分:5)
在Tensorflow 2.0及更高版本上,您可以通过以下方式解决此问题:
os.environ['TF_FORCE_GPU_ALLOW_GROWTH'] = 'true'
或
physical_devices = tf.config.experimental.list_physical_devices('GPU')
if len(physical_devices) > 0:
tf.config.experimental.set_memory_growth(physical_devices[0], True)
答案 1 :(得分:1)
在代码中添加以下内容
from keras.backend.tensorflow_backend import set_session
import tensorflow as tf
config = tf.ConfigProto()
config.gpu_options.allow_growth = True # dynamically grow the memory used on the GPU
config.log_device_placement = True # to log device placement (on which device the operation ran)
sess = tf.Session(config=config)
set_session(sess) # set this TensorFlow session as the default session for Keras