在PyTorch中使用预训练的嵌入时处理OOV单词的最佳方法

时间:2018-12-10 23:03:29

标签: deep-learning nlp pytorch

我正在PyTorch中使用word2vec预训练的嵌入(以下为代码here)。但是,它似乎无法处理看不见的单词。有什么好办法解决吗?

1 个答案:

答案 0 :(得分:0)

FastText构建字符ngram向量作为模型训练的一部分。当找到一个OOV单词时,它将单词中的字符ngram矢量求和,以生成该单词的矢量。您可以找到更多详细信息here