应用错误收集

CBOW word2vec中特定单词的向量是什么？

时间：2018-09-19 07:47:01

标签： nlp word2vec

经典CBOW word2vec看起来像：

此方案中特定单词的向量是什么？它是如何从WI和WO矩阵中获得的？还是仅从Skip-gram word2vec获得有用的单词向量？

1 个答案:

答案 0 :(得分：1)

关于您显示的图表， WI 矩阵中的每一行都是一个单词向量。（训练后，当您向模型询问类似“猫”的单词时，它将找出从0到 V 的哪个插槽存储了“猫”，然后返回 WI < / em>矩阵。）

WI 用随机的低幅值向量初始化。 WO 在训练开始时保留为零。在训练期间，通过反向传播校正微调，反复改进了 WO 和 WI 的各行，以使网络的输出层对每个（上下文）->（字）培训示例。

对于skip-gram，您可以将此图中的输入层视为单个上下文输入字的单次编码。对于CBOW，您可以认为此图中的输入层将多字上下文中每个单词的计数作为 x _i 值–多数为零（稀疏）。在CBOW中的实践中，在 WI 中查找每个单词，然后将它们的单词向量取平均值以创建隐藏层激活。

skip-gram和CBOW都可以在 WI 中创建有用的单词向量。

相关问题

词向量方向是否具有普遍性？

Tensorflow：Word2vec CBOW模型

CBOW（连续词汇）可理解的代码

如何获得单词矢量坐标

如何使用训练有素的CBOW预测单词

如何解释CBOW词嵌入？

在word2vec中设置“未知”或“未知”词向量的最佳解决方案是什么？

基于skip-gram或CBOW的FastText词嵌入模型

CBOW word2vec中特定单词的向量是什么？

Spacy：单词向量使用什么算法？

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？