如何使用Keras和pad_sequence在向量中的特定位置插入单词?
例如,我有句子:
1) XYZ1 is a specific word
2) Specific word is a XYZ1
上面我们有5个独特的令牌:
XYZ1: 1, is: 2, a: 3, specific: 4, word: 5
我在pad_sequence中的序列最大长度等于10.
如果我使用text_to_sequences,我得到了:
1) [1, 2, 3, 4, 5]
2) [4, 5, 2, 3, 1]
之后我使用pad_sequence(maxlen = 10)
1) [1, 2, 3, 4, 5, 0, 0, 0, 0, 0]
2) [4, 5, 2, 3, 1, 0, 0, 0, 0, 0]
我的问题是如何将XYZ1之类的单词总是插入向量中的特定位置,例如在向量的第一个或中心位置,并且有另一个单词。
我希望将其用于分类。
编辑:
1)XYZ1 is a specific word
2) Hello, my name is BBB2 and I tell you
3) Your doing it AAA2 wrong
我的数据中有这些特定的单词(作为第一列(XYZ1,BBB2,AAA2)),我希望将这些单词插入到向量中的正确位置。如果我决定将其插入中央,输出向量:
[0, 1 , 2, 3, BBB2, 4, 5, 6, 7, 8]
所有单词必须位于向量中的相同位置。