什么是预期的convolution1d_1有形状

时间:2017-01-16 19:00:44

标签: python machine-learning neural-network keras conv-neural-network

我目前正在使用卷积层来训练神经元,但似乎在输入和输出维度上存在一些问题。

输入包括(x,2050) 输出是(x,13) 因此,对于每行2050列,应该创建一个包含13个元素的数组。

#Define 10 folds:
seed = 7
np.random.seed(seed)
kfold = KFold(n_splits=10, shuffle=False, random_state=None)
print "Splits"
cvscores_acc = []
cvscores_loss = []
hist = []
i = 0
train_set_data_vstacked_normalized_reshaped = np.reshape(train_set_data_vstacked_normalized,train_set_data_vstacked_normalized.shape+(1,))
train_set_output_vstacked_normalized_reshaped = np.reshape(train_set_output_vstacked_normalized,train_set_output_vstacked_normalized.shape+(1,))
for train, test in kfold.split(train_set_data_vstacked_normalized_reshaped):

    print "Model definition!"
    model = Sequential()

    model.add(Convolution1D(13, 3, border_mode='same', input_shape=(2050,1)))

    print "Compiling"
    model.compile(loss='mean_squared_error', optimizer="RMSprop")
    print "Compile done! "

    print '\n'

    print "Train start"

    reduce_lr=ReduceLROnPlateau(monitor='val_loss', factor=0.01, patience=3, verbose=1, mode='auto', epsilon=0.0001, cooldown=0, min_lr=0.00000001)
    stop  = EarlyStopping(monitor='val_loss', min_delta=0, patience=5, verbose=1, mode='auto')

    log=csv_logger = CSVLogger('training_'+str(i)+'.csv')


    hist_current = model.fit(train_set_data_vstacked_normalized_reshaped[train],
                                train_set_output_vstacked_normalized_reshaped[train],
                                shuffle=False,
                                validation_data=(train_set_data_vstacked_normalized_reshaped[test],train_set_output_vstacked_normalized_reshaped[test]),
                                validation_split=0.1,
                                nb_epoch=150,
                                verbose=1,
                                callbacks=[reduce_lr,log,stop])

    hist.append(hist_current)

    print()
    print model.summary()
    print "Model stored"
    model.save("Model"+str(i)+".h5")
    model.save_weights("Model"+str(i)+"_weights.h5")
    del model
    print "New Model:"
    i=i+1

我似乎在输入数据方面遇到了问题,我在某处读到Convolution1D期望输入为3d的输出和输出,这就是为什么我将其重新整形为3d ..但出于某种原因isn&# 39;它仍然不合适。

我使用当前代码收到此错误:

Exception: Error when checking model target: expected convolution1d_1 to have shape (None, 2050, 13) but got array with shape (221286, 13, 1)

为什么我无法开始训练?...

1 个答案:

答案 0 :(得分:0)

所以基本上 - 在你的网络中你有:

  • 一个输入,其构成一维特征向量的序列,每个长度为2050。
  • 您正在应用一组13个一维卷积特征与kernel_size = 3 same边界模式中的内容正在生成长度为2050的13维特征向量序列。

这解释了为什么Keras会向您展示它期望(None, 2050, 13)目标形状。

有几种方法可以使它有效:

  1. 您可以通过添加以下内容来平衡卷积层的输出:

    from keras.layers import Flatten, Dense 
    model.add(Flatten())
    model.add(Dense(13))
    

    然后按train_set_output_vstacked_normalized_reshaped[train].reshape((221286, 13))

  2. 展平你的目标
  3. 通过添加另一个卷积层与池和不同的边界模式相结合,以获得长度为13的输出序列。这里有很多可能性,我将跳过这一部分。

  4. 请注意 - 您在此处仅使用激活功能。而在最终的dense层中,似乎是一个很好的决定,在之前的图层中,应用一些非线性激活(如relu)以使您的网络更好地工作是件好事