当HDF5中的文件数小于批处理时会发生什么

时间:2017-05-16 05:38:18

标签: machine-learning neural-network deep-learning caffe

我有一个hdf5层,它将list.txt中的信息读取为

layer {
  name: "data"
  type: "HDF5Data"
  top: "data"
  top: "label"
  include {
    phase: TEST
  }
  hdf5_data_param {
    source: "./list.txt"
    batch_size: 4
    shuffle: true
  }
}

其中list.txt包含两个路径文件

/home/user/file1.h5
/home/user/file2.h5

批量大小为4.上述代码会发生什么?数据可以选择4个文件来提供网络吗?

1 个答案:

答案 0 :(得分:2)

您有两个hdf5文件,但每个文件可能包含多个训练示例。因此,实际上,您可能会有超过batch_size: 4个例子。

Caffe并不真正关心训练样例的实际数量:当它完成处理所有示例(又名" epoch")时,它只是重新开始阅读样本。 Caffe循环遍历所有样本,直到达到训练/测试迭代次数。