有人能给我一个直观的解释,说明为什么我们使用单词嵌入以及神经网络如何使这个过程更容易和更好?
答案 0 :(得分:1)
Word嵌入是自然语言处理(NLP)中一组语言建模和特征学习技术的统称,其中词汇表中的单词或短语被映射到实数的向量。
有许多分支机构和许多研究小组致力于字嵌入。 2013年,由Tomas Mikolov领导的Google团队创建了word2vec
,这是一个嵌入式工具包,可以比以前的方法更快地训练向量空间模型。大多数新词嵌入技术依赖于神经网络架构而不是更传统的n -gram模型和无监督学习。
为什么较新的方法依赖于神经网络?主要是因为他们可以更快,更有效地解决问题。造成这种情况的部分原因是神经架构将整个排序序列考虑在内,而不是单独考虑每个单词。
有关更详细的解释,您可能想要做一些研究。阅读this博文可能是一个好的开始。