根据文档,LSTM层应处理(无,CONST,CONST)形状的输入。对于可变的时间步长,它应该能够处理(无,无,CONST)形状的输入。
假设我的数据如下:
X = [
[
[1, 2, 3],
[4, 5, 6]
],
[
[7, 8, 9]
]
]
Y = [0, 1]
还有我的模特:
model = tf.keras.models.Sequential([
tf.keras.layers.LSTM(32, activation='tanh',input_shape=(None, 3)),
tf.keras.layers.Dense(1, activation='sigmoid')
])
model.compile(loss='categorical_crossentropy', optimizer='adam')
model.fit(X, Y)
我的问题是:我应如何格式化这些输入以使此代码正常工作?
我不能像以前那样在这里使用熊猫数据框。如果运行上面的代码,则会出现此错误:
Error when checking model input: the list of Numpy arrays that you are passing to your model is not the size the model expected. Expected to see 1 array(s), but instead got the following list of 2 arrays:
如果我用:更改最后一行:
model.fit(np.array(X), np.array(Y))
错误现在是:
Error when checking input: expected lstm_8_input to have 3 dimensions, but got array with shape (2, 1)
答案 0 :(得分:1)
您很近,但是在Keras / Tensorflow中,您需要填充序列,然后使用Masking让LSTM跳过那些填充的序列。 为什么?因为张量中的项需要具有相同的形状(batch_size, max_length, features)
。因此,如果长度可变,则会填充序列。
您可以使用keras.preprocessing.sequence.pad_sequences填充序列以获得类似的内容:
X = [
[
[1, 2, 3],
[4, 5, 6]
],
[
[7, 8, 9],
[0, 0, 0],
]
]
X.shape == (2, 2, 3)
Y = [0, 1]
Y.shape == (2, 1)
然后使用遮罩层:
model = tf.keras.models.Sequential([
tf.keras.layers.Masking(), # this tells LSTM to skip certain timesteps
tf.keras.layers.LSTM(32, activation='tanh',input_shape=(None, 3)),
tf.keras.layers.Dense(1, activation='sigmoid')
])
model.compile(loss='binary_crossentropy', optimizer='adam')
model.fit(X, Y)
您还需要binary_crossentropy
,因为您在输出sigmoid
时遇到二进制分类问题。