Pytorch 使用以下值作为 cifar10 数据的均值和标准值: transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
我需要理解计算背后的概念,因为这个数据是 3 通道图像,我不明白什么是相加和除以什么等等。 另外,如果有人可以分享计算平均值和标准的代码,那就太感谢了。
答案 0 :(得分:0)
0.5 值只是三个通道 (r,g,b) 上 cifar10 平均值和标准值的近似值。 cifar10 训练集的精确值是
0.49139968, 0.48215827 ,0.44653124
0.24703233 0.24348505 0.26158768
您可以使用以下脚本计算这些:
import torch
import numpy
import torchvision.datasets as datasets
from torchvision import transforms
cifar_trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transforms.ToTensor())
imgs = [item[0] for item in cifar_trainset] # item[0] and item[1] are image and its label
imgs = torch.stack(imgs, dim=0).numpy()
# calculate mean over each channel (r,g,b)
mean_r = imgs[:,0,:,:].mean()
mean_g = imgs[:,1,:,:].mean()
mean_b = imgs[:,2,:,:].mean()
print(mean_r,mean_g,mean_b)
# calculate std over each channel (r,g,b)
std_r = imgs[:,0,:,:].std()
std_g = imgs[:,1,:,:].std()
std_b = imgs[:,2,:,:].std()
print(std_r,std_g,std_b)