应用错误收集

动态RNN：填充词向量

时间：2018-10-16 09:27:15

标签： tensorflow padding rnn

我对填充有点困惑，我的第一个问题是：

是否可以将较短的序列填充为非0的值？那么您如何在RNN中处理呢？
通常使用0进行填充，请问为什么有特定原因？是否因为它不影响计算而使训练变得容易，或者您仍然需要掩盖损失函数？
如果您的句子是由word2vec模型中嵌入的向量组成的，那么填充将用作零向量吗？

在此先感谢任何提示！

1 个答案:

答案 0 :(得分：0)

您的问题已在How to overcome training example's different lengths when working with Word Embeddings (word2vec)中解决。

有关最小/最大交替填充方法的详细信息，请参见Apply word embeddings to entire document, to get a feature vector。

另请参见：keras.preprocessing.sequence.pad_sequences，它可以使用一个值作为参数。