应用错误收集

这些词嵌入也称为分布式词嵌入基于

您知道它保留的公司一个字

因此，我们通过单词的上下文了解单词的含义。您可以想到向量（一个单词）中的每个标量代表其概念的强度。 Prof. Pawan Goyal的这张幻灯片对此进行了说明。

因此，您希望有一个好的矢量大小来捕获相当数量的概念，但又不想太大的矢量，因为它会成为训练使用这些嵌入的模型的瓶颈。

向量的大小也是固定的，因为大多数人不训练自己的嵌入，而是使用公开可用的嵌入，因为它们在海量数据上训练了许多小时。因此，使用它们将迫使我们使用嵌入层，其尺寸由您正在使用的公开可用嵌入（word2vec，手套等）给出。

分布式词嵌入是NLP深度学习领域的一个重要里程碑。与基于tfidf的嵌入相比，它们提供了更好的准确性。