我很困惑如何使用keras在RNN中处理字符级别信息。我想要实现类似model structure的东西。 我有1800个句子;每个句子长度(time_stamp)150,每个单词长度有16个字符。 Gensim模型可帮助我创建大小为100的单词嵌入。句子中的唯一字符为69,对于一个热编码表示的每个字符为70。
单词级双向输入法的形状为:句子X timestamp X X embedding_size(1800 x 150 x 100) 我知道如何将其输入到keras层中,但是我对字符级输入感到困惑。字符级的形状是:句子X timestamp X字符X char_embedding(1800 x 150 x 16 x 70)。 我是keras的初学者。
答案 0 :(得分:0)
图像中的内容是一个简单的双向LSTM:
model = Sequential()
model.add(Bidrectional(LSTM(128), input_shape=(maxlen, len(chars))))
# Bidrectional concatenates the output of both directions by default.
有关完整示例,您可以查看使用字符级处理的text generation示例。