如果我有一个将输入成对输入的暹罗网络,例如my_input = ( Total_examples, 2, frame number , hight, width, channel)
,那么我的问题是
input1= my_input[:, 0, :, :, :, :]
和input2= my_input[:, 2, :, :, :, :]
的平均值和标准差。example - mean
的总数。我的问题是我尝试了两次实验以查看该值是否准确;一次是在500个示例的数据集上,然后直接对整个数据进行均值和标准差的计算;第二次是对该数据集的批次进行一次实验,一次是100个示例,如果在dtype = np.float32
操作中使用np.sum
或更小值,则均值和标准差将不同;如果使用dtype= npfloat.64
或np.flot128
,则均值和标准差将相同。而且我知道造成这种差异的原因是由于精度和溢出。因此,这是否意味着如果我有大型数据集,并且想对数据流进行某些操作,那么在求和运算中应该使用np.float64
而不是np.float.32
?