我正在尝试按照此paper上显示的说明实施质量检查系统。我已经正确导入了一些数据集,并使用word2vec方法将单词转换为向量。嵌入单词后,需要在CNN中插入问题和答案。鉴于每个问题/答案的长度不同,输入张量的大小应该是多少? (每个问题/答案都是向量数组)。
论文摘录:
q_emb 是单词嵌入后的问题,而 r_w_k 是长度为 d 。
应使用哪个正确的 M 值(Q / A的长度)?您能告诉我一些解决此问题的方法还是直接给我一些帮助?谢谢
答案 0 :(得分:3)
确定问题/答案向量的最大长度,并使输入张量的形状为(num_samples, max_qa_length, word_embedding_size)
。对于短于max_qa_length
的问题,请在结尾处添加零个向量。