标签: nlp gensim word2vec word-embedding
我有一个word2vec模型,我想通过在单词本身出现的旁边添加一些其他数据来对其进行更改。
例如:
类别(超出预定义的50个),POS等。
我想到了两种方法:
所以我的问题是: 1.什么是更好的方法? 2.如何创建新的损失函数并在Word2Vec中对其进行优化?我可以仅将参数传递给Gensim的Word2Vec,还是需要从头开始构建新的Word2vec模型?