我有一个关于 Phototour 数据集均值和标准差计算的问题。
Phototour 数据集提供了所有形状为 (64,64,1)
的相应补丁来训练描述符(通常是 CNN 网络)。
这些补丁是从原始图像中提取的。这些原始图像是由来自世界各地的游客从特定地点(Notredame、Liberty、Yosemite)以不同的图像分辨率拍摄的。每个补丁 (32, 32) 的中心是 SIFT 检测器检测到的关键点。
例如,在这些数据集中,我们有近 50 万个补丁,这些补丁是从 Notredame 的 715 个图像中提取的。
数据集链接: http://phototour.cs.washington.edu/
在 Pytorch Phototour 数据集中,他们定义如下:
means = {'notredame': 0.4854, 'yosemite': 0.4844, 'liberty': 0.4437,
'notredame_harris': 0.4854, 'yosemite_harris': 0.4844, 'liberty_harris': 0.4437}
stds = {'notredame': 0.1864, 'yosemite': 0.1818, 'liberty': 0.2019,
'notredame_harris': 0.1864, 'yosemite_harris': 0.1818, 'liberty_harris': 0.2019}
任何帮助将不胜感激。
答案 0 :(得分:0)
通常,您会测量训练集的均值和标准差。您通常必须为每个功能(或通道:这里有一个通道)同时测量两者。这里 Notre Dame、Yosemite 和 Liberty 在某种程度上被视为三个独立的数据集:
<块引用>按照以下链接下载 3 个数据集的 zip 文件
此外,它与提取的补丁的均值/标准相对应是有意义的。由于 torchvision.datasets.PhotoTour
是包含与论文 Learning Local Image Descriptors Data [1] 相关联的 16x16-patch 网格的数据集。
[1]:S. Winder 和 M. Brown。学习本地图像描述符。参加计算机视觉与模式识别国际会议(CVPR2007)