以TFIDF作为输入的LSTM,尺寸误差

时间:2020-06-23 12:21:56

标签: machine-learning keras deep-learning lstm tf-idf

我正在尝试使用TFIDF作为输入来运行LSTM,但出现错误。我有TFIDF,每个条目都有11915个维度

代码如下:

## Creating model
model=Sequential()
model.add(Bidirectional(LSTM(100, input_shape=(1, 11915),return_sequences=True)))
model.add(Dropout(0.3))
model.add(Dense(1,activation='sigmoid'))
model.build(input_shape=(1, 11915))
model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
print(model.summary())

错误如下 双向_27层的输入0与该层不兼容:预期的ndim = 3,找到的ndim = 2。收到的完整图形:[1,11915]

我是这个领域的新手,我们将不胜感激。如果有人为在这样的输入上运行双向LSTM编写伪代码,那将是非常好的

我的输入是10229 * 11915的tfidf。我想在TFIDF上使用LSTM作为输入进行假新闻检测

2 个答案:

答案 0 :(得分:2)

您要在input_shape层中指定Bidirectional

model.add(Bidirectional(LSTM(100, return_sequences=True), input_shape=(1, 11915)))

答案 1 :(得分:2)

这是一个完整的工作示例

# create fake data
n_sample = 10229
X = np.random.uniform(0,1, (n_sample,11915))
y = np.random.randint(0,2, n_sample)

# expand X to 3D
X = X.reshape(X.shape[0],1,X.shape[-1])

model=Sequential()
model.add(Bidirectional(LSTM(100, return_sequences=False), input_shape=(1, 11915)))
model.add(Dropout(0.3))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
print(model.summary())

model.fit(X,y, epochs=3, batch_size=256)

发生此错误是因为您可能未正确管理您的数据。还请注意正确定义第一层,并且return_sequences = False,因为您的输出是2D