fasttext skipgram和word2vec skipgram有什么区别?

时间:2019-04-16 03:58:53

标签: nlp fasttext

给出一个句子“ hello world”,词汇是

{hello,world} + {},

为方便起见,只列出所有4克。

以我的理解,单词2vec跳过图将最大化

快速文本跳过图会做什么?

1 个答案:

答案 0 :(得分:0)

tl; dr

优化标准相同,不同之处在于模型获取单词向量的方式。

使用公式

Fasttext优化了与标准Skipgram模型相同的条件(使用FastText paper中的公式):

enter image description here

具有使优化计算有效的所有近似技巧。最后,他们得到了:

enter image description here

所有词 w c 上都有一个总和,并使用一些负样本 n 近似分母。关键区别在于函数 s 。在原始的跳过语法模型中,它是两个单词嵌入的点积。

但是,在FastText情况下,函数 s 被重新定义:

enter image description here

单词 w t 表示为单词组成的所有n-grams z g 的总和加上单词本身的向量。基本上,您不仅要使单词,而且还要使它的所有子字符串在给定的上下文窗口中都可能出现。