应用错误收集

我听到了很多与word2vec一起使用的术语“负采样”和“子采样”。

在我试图弄乱word2vec之前，我试图回顾一下参考单词嵌入的论文，并从头开始。纸质小道让我来到这里：

并声明：

（我熟悉所有子弹点减去第一个）

我在负采样和子采样中发现的唯一内容已经包含在关于word2vec的文章中，这就是我想要避免的。

如果有人能够解释这些条款或指出我正确的方向，那将非常感激:)。

编辑：它自己的子采样标签导致了这个定义：

“子采样是一种类似于引导程序的重采样程序，其中使用替换绘制的观察数量少于所有观察结果（与教科书引导程序方法中使用的原始样本大小相比）。要从现有数据中创建样本，请考虑而是“取样”标签。“ ---这个具体的例子很棒。