在QA系统中训练具有不同长度句子的神经网络

时间:2018-08-20 17:36:46

标签: neural-network word2vec question-answering

我正在尝试按照此paper上显示的说明实施质量检查系统。我已经正确导入了一些数据集,并使用word2vec方法将单词转换为向量。嵌入单词后,需要在CNN中插入问题和答案。鉴于每个问题/答案的长度不同,输入张量的大小应该是多少? (每个问题/答案都是向量数组)。

论文摘录:

enter image description here

q_emb 是单词嵌入后的问题,而 r_w_k 是长度为 d 。

应使用哪个正确的 M 值(Q / A的长度)?您能告诉我一些解决此问题的方法还是直接给我一些帮助?谢谢

1 个答案:

答案 0 :(得分:3)

确定问题/答案向量的最大长度,并使输入张量的形状为(num_samples, max_qa_length, word_embedding_size)。对于短于max_qa_length的问题,请在结尾处添加零个向量。