我目前正在使用Keras构建可对文本进行分类的CNN。的开始看起来像:
sequence_input = tf.keras.layers.Input(shape=(100,), name='reviews', dtype='int32')
x = tf.keras.layers.Embedding(input_dim=self.vocab_size + 1,
output_dim=40,
input_length=100,
trainable=True,
mask_zero=False)(sequence_input)
x = tf.keras.layers.SpatialDropout1D(0.4)(x)
但是,现在我想包括不需要任何嵌入的其他功能。对于每个审阅,我将包括诸如审阅中的单词数,审阅中的平均音节数等内容。我在Pandas DataFrame中具有此信息以及标记化文本。因此,前100列是代表特定单词的整数,第101列和第102列是复习单词的数量以及复习每个单词的平均音节数。
我应该如何包含这些信息?
谢谢!