在PyTorch中使用预训练的输出线性投影层

时间:2020-01-15 16:12:22

标签: nlp pytorch projection

对于将一个LSTM网络的某些预训练输出线性投影层用于另一个LSTM网络,我有一个特定的问题。

我所拥有的: 1.预训练的完全连接层,用于将某些语言生成模型的单词概率输出到实际单词中,例如:

self.output_linear_projection = nn.Linear(self.wordRNN_dim, self.vocab_size)

  • 在这里,self.wordRNN_dim是512(LSTM的隐藏大小),self.vocab_size是我的单词数。对于此预训练模型,词汇量为10509,其中有10508个单词,最后一个元素是<end><start>令牌的投影(这些令牌使用相同的投影)

    1. 我的语言生成模型,我想使用预训练模型的输出线性投影层。我的模型的词汇表中还包含<pad>令牌,该令牌在预训练的模型中不存在。所以我的词汇量是10510。

问题: -如果要在模型中使用此预训练的输出线性投影层,我应该/应该怎么做?不投射<pad>令牌是否有些常规?如果是这样,我应该以某种方式忽略它吗?而且,如果我有任何步骤要采取,是否有任何在PyTorch中进行操作的提示?

0 个答案:

没有答案