在word2vec中,将字典中的单词映射到N维空间中的坐标是很常见的。有没有办法扭转这个过程,并在空间中的任何位置合成一个单词?
答案 0 :(得分:1)
当从坐标转到单词时,没有必要在您正在查看的坐标处嵌入矢量。一种方法是搜索最接近的向量并返回相应的单词。 假设您有[1,2,4]代表的“猫”,[2,1,6]代表“狗”等等。
index2word = ["cat","dog","crow","owl"]
vecArray=[[1,2,4],
[2,1,6],
[9,1,5],
[4,6,2]]
query=[2,1,7] #the vector whose word is required
distance=dot(vecArray,query)
查找距离数组的最小元素索引。用它来从index2word数组中获取单词。
答案 1 :(得分:0)
您可以将n维坐标编码为字符串,并将其与坐标字符串进行比较。