我正在尝试复制论文的工作(关于文本的二进制分类)以形成模型的基准-论文说:“使用上述预先训练的GloVE模型,将这些标记化的推文转换为嵌入的结果。然后将向量序列馈送到LSTM,该LSTM输出单个32维向量,然后将其馈送到2个大小为128和64的ReLU激活层中,以产生输出”
那会转化为:
model_glove1 = Sequential()
model_glove1.add(Embedding(vocabulary_size, 25, input_length=50, weights=[embedding_matrix25],trainable=False))
model_glove1.add(LSTM(32))
model_glove1.add(Dense(128, activation='relu'))
model_glove1.add(Dense(64, activation='relu'))
model_glove1.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy',auc_roc])
当损失函数binary_crossentropy期望形状为(1,)时,最后一个致密层的输出将为形状(64,)