我见过很多例子,展示如何在Caffe中插入模型训练的图像数据。
我正在尝试使用非图像数据训练模型。我可以将其重塑为矩阵或向量(对于每个示例),但我不了解如何让我的Caffe网络读取它。
我知道Caffe可以使用lmdb / hdf5数据库,我还可以使用Python数据层。 我想Python数据层将是我的最佳选择。有人可以提供一个如何在Python中创建某种数组并将其用作Caffe模型的训练数据的示例吗?
答案 0 :(得分:1)
您不需要为简单的矢量输入创建python层。 HDF5层可能最容易使用。只需使用您喜欢的工具创建HDF5文件(参考this使用matlab创建HDF5,或使用this创建使用python)
这两个例子都很容易理解。 matlab示例为您提供了更多高级版本的HDF5文件创建 - 如创建批次和所有 - 但其核心只需要调用
store2hdf5(filename, data, labels) %others are optional
同样,python示例也是完整的示例,所有这些都是您可能需要或不需要的。其核心是创建HDF5文件。
import h5py
with h5py.File('filename.h5', 'w') as f:
f['data'] = your_data
f['label'] = your_labels
您可以轻松地轻松使用在HDF5 Datalayer中创建的文件,如下所示。您只需要创建一个包含要使用的HDF5文件列表的文本文件。
layer {
name: "data"
type: "HDF5Data"
top: "data"
top: "label"
include {
phase: TRAIN
}
hdf5_data_param {
source: "path_to_text_file_containing_list_of_HDF5_Files.txt" #
batch_size: 128
shuffle: true
}
}