OOV词的词嵌入

时间:2017-12-28 14:47:23

标签: machine-learning nlp word2vec gensim

我已经从语料库中生成了单词向量,但是我面临很多单词的词汇问题。如何使用现有的单词嵌入动态生成OOV字的单词向量?

1 个答案:

答案 0 :(得分:2)

一个很晚的答案(甚至不是您要寻找的答案),但是,使用skip-gram模型,您几乎不可能做到,因为每个单词本身就是一个不同的实体。

您可以使用FastText来完成所需的功能。它使用n-gram来生成OOV字向量。

Gensim具有高级API来使用FastText。