在keras中嵌入单词位置

时间:2018-05-03 11:52:56

标签: python nlp keras word2vec word-embedding

我正在尝试使用CNN构建药物 - 药物相互作用的关系提取系统,并且需要为我的句子中的单词进行嵌入。计划是将句子中的每个单词表示为3个嵌入的组合:(w2v,dist1,dist2)其中w2v是预训练的word2vec嵌入,dist1和dist2是句子中每个单词与两个药物之间的相对距离可能是相关的。

我对如何解决填充问题感到困惑,因此每个句子的长度相等。在嵌入任何嵌入之前,我应该用一系列字符串(什么字符串?)填充标记的句子来平衡它们的长度?

1 个答案:

答案 0 :(得分:0)

您可以计算之间的最大间隔 实体提及由关系链接并选择一个 输入宽度大于此距离。这将确保 每个输入(关系提及)具有相同的长度 通过修剪更长的句子和填充更短 带有特殊标记的句子。