Phototour 数据集均值和标准差的计算

时间:2021-01-01 15:24:20

标签: python pytorch dataset std mean

我有一个关于 Phototour 数据集均值和标准差计算的问题。

Phototour 数据集提供了所有形状为 (64,64,1) 的相应补丁来训练描述符(通常是 CNN 网络)。 这些补丁是从原始图像中提取的。这些原始图像是由来自世界各地的游客从特定地点(Notredame、Liberty、Yosemite)以不同的图像分辨率拍摄的。每个补丁 (32, 32) 的中心是 SIFT 检测器检测到的关键点。 例如,在这些数据集中,我们有近 50 万个补丁,这些补丁是从 Notredame 的 715 个图像中提取的。

数据集链接: http://phototour.cs.washington.edu/

在 Pytorch Phototour 数据集中,他们定义如下:

means = {'notredame': 0.4854, 'yosemite': 0.4844, 'liberty': 0.4437,
         'notredame_harris': 0.4854, 'yosemite_harris': 0.4844, 'liberty_harris': 0.4437}
stds = {'notredame': 0.1864, 'yosemite': 0.1818, 'liberty': 0.2019,
        'notredame_harris': 0.1864, 'yosemite_harris': 0.1818, 'liberty_harris': 0.2019}
  1. 如何重现这两个参数?
  2. 我必须在提取的补丁原始图像上计算平均值和标准吗?

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

通常,您会测量训练集的均值和标准差。您通常必须为每个功能(或通道:这里有一个通道)同时测量两者。这里 Notre DameYosemiteLiberty 在某种程度上被视为三个独立的数据集:

<块引用>

按照以下链接下载 3 个数据集的 zip 文件

此外,它与提取的补丁的均值/标准相对应是有意义的。由于 torchvision.datasets.PhotoTour 是包含与论文 Learning Local Image Descriptors Data [1] 相关联的 16x16-patch 网格的数据集。

[1]:S. Winder 和 M. Brown。学习本地图像描述符。参加计算机视觉与模式识别国际会议(CVPR2007)

相关问题