应用错误收集

作为本文第3部分的图形构建过程的一部分，我需要定义某种相似性度量来计算连接一对节点的每条边的边缘权重。根据该论文，我必须为此创建一个PMI（Pointwise Mutual Information）向量。我要做的是计算每个令牌上发生的特征的PMI。

本文将每个n-gram命名为“type”，并将其中每个n-gram命名为“token”。

作为一个例子，如果我们将x2-x3-x4作为我们当前的类型，它发生在两个上下文x1-x2-x3-x4-x5和x6-x2-x3-x4-x7中，我必须计算一组与x2-x3-x4类型相关的功能。但不知何故，这个程序似乎很复杂而且不清楚。这就是我得到的：

我应该计算每个令牌上每个功能的PMI。这导致每个标记的PMI向量，最终结果将是当前类型的PMI向量数组。数组大小将等于给定类型的标记数。现在作为最后一步，我应该测量不同节点的相似性。但问题是每种类型的结果矢量数组都有不同的大小，所以我无法将这些数组相互比较。

那么，解决方案是什么？我在这里犯了错误吗？