Question

我最近编写并运行了这段代码，以与Theano和Keras一起训练CNN：

#Building the model
model = Sequential()
model.add(Convolution2D(32, 3, 3, activation='relu', input_shape=(1,8,182)))
model.add(Convolution2D(32, 3, 3, activation='relu'))
model.add(Convolution2D(32, 3, 3, activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(2, activation='softmax'))

#Compiling the CNN
model.compile(loss='binary_crossentropy', optimizer='sgd', metrics=['binary_accuracy'])

#Fitting data and training the model
model.fit(X_train, y_train, batch_size=32, nb_epoch=100, verbose=1) 

#Saving weights
model.save_weights('trained_cnn.h5', overwrite=True)

我在CPU上对其进行了测试，每个时期大约花费了3分钟。第一个纪元的示例输出如下：

Epoch 1/100
72000/72000 [==============================] - 204s - loss: 0.6935 - binary_accuracy: 0.5059

现在，我已迁移到Nvidia Titan X GPU。我还被迫转移到Keras 2，因此对我的代码进行了如下更新，以实现必要的更改：

#Building the model
model = Sequential()
model.add(Conv2D(32, 3, activation='relu', input_shape=(1,8,182)))
model.add(Conv2D(32, 3, activation='relu'))
model.add(Conv2D(32, 3, activation='relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(2, activation='softmax'))

#Compiling the CNN
model.compile(loss='binary_crossentropy', optimizer='sgd', metrics=['binary_accuracy'])

#Fitting data and training the model
model.fit(X_train, y_train, batch_size=32,epochs=100, verbose=2)

#Saving weights
model.save_weights('trained_cnn_b_2.h5', overwrite=True)

现在，每当我在GPU上运行时，程序都会被卡住

epoch 1/100

此后没有任何反应，即使我等待了10分钟以上。为什么会发生这种情况，我该如何解决？除了Keras函数外，我没有更改任何代码。没有引发任何错误。我要去哪里错了？冗长的命令是否有问题，该命令停止了程序的执行？

编辑1：我已经让我的设置运行一整夜，但是在那一行之后仍然没有执行。

编辑2：我正在使用CUDA 7.5.17

编辑3：here中的该程序运行正常。可以在不到10秒的时间内完成执行。

# Create your first MLP in Keras
from keras.models import Sequential
from keras.layers import Dense
import numpy
# fix random seed for reproducibility
numpy.random.seed(7)
# load pima indians dataset
dataset = numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X = dataset[:,0:8]
Y = dataset[:,8]
# create model
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# Fit the model
model.fit(X, Y, epochs=150, batch_size=10)
# evaluate the model
scores = model.evaluate(X, Y)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

注意：我已经验证我的GPU可以正常工作。

编辑：我迁移到Tensorflow，并且CUDA版本低于9时没有问题。使用Tensorflow，程序可以完美执行。

Keras-深度学习模型不训练

0 个答案: