有text_classification.py示例通过两种方法(bow和rnn)对文本进行分类。
我试图了解这里实际发生了什么。首先,让我们看看bag_of_words_model
。它运行bow_encoder
。通过运行bow_encoder
,它定义了图层,并且在梯度下降的每一步中都会不断更新嵌入向量?然后,它平均向量通过W2
将其连接到输出。所以这里我们有两个W
矩阵。一个是从输入到嵌入层,第二个是从平均向量到输出(这个架构实际上让我想起了word2vec模型)。对?
第二个模型 - rnn_model
。它调用embed_sequence
,embed_sequence
类似于rnn_model
,但不是平均嵌入向量,而是将它们连接起来。正确?
我将不胜感激。