我是word2vec和tensorflow的新手。我想在Python上使用TensorFlow训练word2vec模型。
我研究过tensorflow的word2vec_basic.py。在此培训过程中,输入和输出仅由索引表示,其实质上是整数(根据我的理解)。但是,就我而言,我想通过 vector 来表示输入和输出。在某些设计操作之后,该向量可以是单热编码向量或其他向量。
我研究了一些在培训过程中调用的tf.nn.embedding_lookup
,tf.nn.nce_loss
等函数,但我想知道这些函数只适用于 index 。是否可以按照我的意愿使用向量,同时,我基本可以在word2vec_basic.py中使用相同的代码结构?
如果这是不可能的,那么您是否有任何好主意用矢量作为输入和输出来实现模型训练?