我已经看到了另一个StackOverflow线程,它在讨论用于计算欧几里得范数的各种实现,而我很难理解为什么/如何实现特定的实现。
可在MMD指标的实现中找到该代码:https://github.com/josipd/torch-two-sample/blob/master/torch_two_sample/statistics_diff.py
这是一些开始的样板:
import torch
sample_1, sample_2 = torch.ones((10,2)), torch.zeros((10,2))
然后下一部分是我们从上面的代码中提取的内容。.我不确定为什么将这些样本连接在一起。
sample_12 = torch.cat((sample_1, sample_2), 0)
distances = pdist(sample_12, sample_12, norm=2)
,然后传递给pdist函数:
def pdist(sample_1, sample_2, norm=2, eps=1e-5):
r"""Compute the matrix of all squared pairwise distances.
Arguments
---------
sample_1 : torch.Tensor or Variable
The first sample, should be of shape ``(n_1, d)``.
sample_2 : torch.Tensor or Variable
The second sample, should be of shape ``(n_2, d)``.
norm : float
The l_p norm to be used.
Returns
-------
torch.Tensor or Variable
Matrix of shape (n_1, n_2). The [i, j]-th entry is equal to
``|| sample_1[i, :] - sample_2[j, :] ||_p``."""
这是计算的重点
n_1, n_2 = sample_1.size(0), sample_2.size(0)
norm = float(norm)
if norm == 2.:
norms_1 = torch.sum(sample_1**2, dim=1, keepdim=True)
norms_2 = torch.sum(sample_2**2, dim=1, keepdim=True)
norms = (norms_1.expand(n_1, n_2) +
norms_2.transpose(0, 1).expand(n_1, n_2))
distances_squared = norms - 2 * sample_1.mm(sample_2.t())
return torch.sqrt(eps + torch.abs(distances_squared))
为什么要以这种方式计算欧几里得规范,我感到茫然。任何见识将不胜感激
答案 0 :(得分:4)
让我们逐步遍历此代码块。欧几里得距离的定义,即L2范数是
让我们考虑最简单的情况。我们有两个示例
样本var y0= d3.scaleBand().paddingInner(0.1).range([0, canvasHeight]);
有两个向量a
和[a00, a01]
。样本[a10, a11]
相同。首先计算b
norm
现在我们得到
接下来,我们有n1, n2 = a.size(0), b.size(0) # here both n1 and n2 have the value 2
norm1 = torch.sum(a**2, dim=1)
norm2 = torch.sum(b**2, dim=1)
和norms_1.expand(n_1, n_2)
请注意,norms_2.transpose(0, 1).expand(n_1, n_2)
已换位。两者之和为b
norm
,这是两个矩阵的乘积。
因此,手术后
sample_1.mm(sample_2.t())
你得到
最后,最后一步是获取矩阵中每个元素的平方根。