Word2Vec +回归-数值评分方法

时间:2018-07-04 07:05:05

标签: python tensorflow machine-learning neural-network word2vec

我想建立一个神经网络,以单词和数值作为输入,而数值作为输出。

为此,我认为最合适的解决方案是在单词组上使用Word2Vec算法以获得嵌入,然后用它们和其他输入/输出训练神经网络(可能是LSTM)。

但是如何实现呢? 由于每个单词都有一个权重向量(感谢Word2Vec算法),如何训练神经网络来预测数值(换句话说就是回归)? 或者至少,如何将这个权重向量转换为有意义的数值? (我实际上不知道如何将数值向量和“简单”数值的向量一起训练神经网络。)

我试图在Web上检查这些概念,但没有找到与我的目的相关的文章。其中一些是:

-具有逻辑回归的单词嵌入

-https://machinelearningmastery.com/use-word-embedding-layers-deep-learning-keras

-https://pdfs.semanticscholar.org/8eb6/74c76fc471e9cf815921b6329eb4a1bbed30.pdf

1 个答案:

答案 0 :(得分:1)

通常,您将使用cosine similarity之类的距离算法来计算向量之间的距离。 距离越短,您的单词越相似。