Question

我有一个关于 Phototour 数据集均值和标准差计算的问题。

Phototour 数据集提供了所有形状为 (64,64,1) 的相应补丁来训练描述符（通常是 CNN 网络）。这些补丁是从原始图像中提取的。这些原始图像是由来自世界各地的游客从特定地点（Notredame、Liberty、Yosemite）以不同的图像分辨率拍摄的。每个补丁 (32, 32) 的中心是 SIFT 检测器检测到的关键点。例如，在这些数据集中，我们有近 50 万个补丁，这些补丁是从 Notredame 的 715 个图像中提取的。

数据集链接： http://phototour.cs.washington.edu/

在 Pytorch Phototour 数据集中，他们定义如下：

means = {'notredame': 0.4854, 'yosemite': 0.4844, 'liberty': 0.4437,
         'notredame_harris': 0.4854, 'yosemite_harris': 0.4844, 'liberty_harris': 0.4437}
stds = {'notredame': 0.1864, 'yosemite': 0.1818, 'liberty': 0.2019,
        'notredame_harris': 0.1864, 'yosemite_harris': 0.1818, 'liberty_harris': 0.2019}

如何重现这两个参数？
我必须在提取的补丁或原始图像上计算平均值和标准吗？

任何帮助将不胜感激。

Answer 1

通常，您会测量训练集的均值和标准差。您通常必须为每个功能（或通道：这里有一个通道）同时测量两者。这里 Notre Dame、Yosemite 和 Liberty 在某种程度上被视为三个独立的数据集：

<块引用>

按照以下链接下载 3 个数据集的 zip 文件

此外，它与提取的补丁的均值/标准相对应是有意义的。由于 torchvision.datasets.PhotoTour 是包含与论文 Learning Local Image Descriptors Data [1] 相关联的 16x16-patch 网格的数据集。

[1]：S. Winder 和 M. Brown。学习本地图像描述符。参加计算机视觉与模式识别国际会议（CVPR2007）

Phototour 数据集均值和标准差的计算

1 个答案: