用于LSTM建模的Setup Keras选项

时间:2016-07-24 05:34:05

标签: python python-2.7 deep-learning keras recurrent-neural-network

我试图找出预测某些价值的过程。目前,我无法理解以下代码中的问题:

        in_neurons = 1
        out_neurons = 1
        hidden_neurons = 20
        nb_features = 9

        # retrieve data
        y_train = train.pop(target).values
        X_train = pd.concat([train[['QTR_HR_START', 'QTR_HR_END', 'HOLIDAY_RANK_', 'SPECIAL_EVENT_RANK_',
                                    'IS_AM', 'IS_TOP_RANKED', 'AWARDS_WINS_ANY', 'YEARS_SINCE_RELEASE']],
                             pd.DataFrame({'DATETIME': pd.DatetimeIndex(train['DATETIME']).astype(np.int64)})])
        X_train = X_train.values

        y_test = test.pop(target).values
        X_test = pd.concat([test[['QTR_HR_START', 'QTR_HR_END', 'HOLIDAY_RANK_', 'SPECIAL_EVENT_RANK_',
                                    'IS_AM', 'IS_TOP_RANKED', 'AWARDS_WINS_ANY', 'YEARS_SINCE_RELEASE']],
             pd.DataFrame({'DATETIME': pd.DatetimeIndex(test['DATETIME']).astype(np.int64)})])
        X_test = X_test.values

        model = Sequential()
        model.add(TimeDistributed(Dense(8, input_shape=(X_train.shape[0], 100, nb_features), activation='softmax')))
        model.add(LSTM(4, dropout_W=0.2, dropout_U=0.2))
        model.add(Dense(1))
        model.add(Activation("sigmoid"))
        model.compile(loss="mean_squared_error", optimizer="rmsprop", metrics=['accuracy'])

运行代码后,我遇到了一个例外:

  

引发异常('顺序模型中的第一层必须'   例外:Sequential模型中的第一层必须得到input_shapebatch_input_shape参数。

请在我错的地方提出建议

EDIT1:我刚刚按照官方文档中提到的那样配置了模型 - http://keras.io/layers/recurrent/

model.add(LSTM(32, input_dim=nb_features, input_length=100))
model.compile(loss="mean_squared_error", optimizer="rmsprop", metrics=['accuracy'])
  

异常:检查模型输入时出错:预期lstm_input_1有3个维度,但得到的是带有形状的数组(48614,9)

1 个答案:

答案 0 :(得分:3)

它已经过时了,但我发布以备将来使用。 Keras作为输入需要3D数据,如错误所述。它是样品,时间步骤,功能。尽管你有(48614,9)Keras将其视为2D - [样本,特征]。为了解决它,做这样的事情

def reshape_dataset(train):
    trainX = numpy.reshape(train, (train.shape[0], 1, train.shape[1]))
    return numpy.array(trainX)

x = reshape_dataset(your_dataset_48614, 9)

现在X应为48614,1, 9,即[样本,时间步长,功能] - 3D