我使用一个示例来研究嵌入网络,其中一个词汇量= 200,训练样本包含大约20个不同的单词。 vocab的大小是200,这意味着单词数是200。 但实际上,我只使用20个单词(训练样本中的单词):说出word [0]到word [19]。 因此,在嵌入之后,向量[0]对应于单词[0],依此类推。但是vector [20] .. vector [30]…它们匹配什么? 我没有单词[20]或单词[30]。
谢谢。
答案 0 :(得分:0)
它们匹配什么?
什么都没有。在增加词汇量之前,权重将保持在初始化时的权重,几乎可以肯定是随机的。如果您尝试将它们视为单词,那么它们将没有英语定义。
基于训练嵌入会创建一个数字有意义的空间的事实,它们可能对他们有一定的意义,但是这些随机嵌入无法可靠地翻译回英语。