向word2vec中的单词添加元数据

时间:2018-12-20 10:53:38

标签: nlp gensim word2vec word-embedding

我有一个word2vec模型,我想通过在单词本身出现的旁边添加一些其他数据来对其进行更改。

例如:

类别(超出预定义的50个),POS等。

我想到了两种方法:

  1. 只需将元数据连接到单词上即可。 (这样“ desk”一词将被编码为“ desk-furniture-Noun”
  2. 我认为更好的方法是:创建一个新的损失函数,该函数将与单词本身的共现,类别的共现,同现POS等有关。

所以我的问题是: 1.什么是更好的方法? 2.如何创建新的损失函数并在Word2Vec中对其进行优化?我可以仅将参数传递给Gensim的Word2Vec,还是需要从头开始构建新的Word2vec模型?

0 个答案:

没有答案