我正在尝试使用CNN构建药物 - 药物相互作用的关系提取系统,并且需要为我的句子中的单词进行嵌入。计划是将句子中的每个单词表示为3个嵌入的组合:(w2v,dist1,dist2)其中w2v是预训练的word2vec嵌入,dist1和dist2是句子中每个单词与两个药物之间的相对距离可能是相关的。
我对如何解决填充问题感到困惑,因此每个句子的长度相等。在嵌入任何嵌入之前,我应该用一系列字符串(什么字符串?)填充标记的句子来平衡它们的长度?
答案 0 :(得分:0)
您可以计算之间的最大间隔 实体提及由关系链接并选择一个 输入宽度大于此距离。这将确保 每个输入(关系提及)具有相同的长度 通过修剪更长的句子和填充更短 带有特殊标记的句子。