如何将图像文件夹转换为h5文件?还是有其他类型的文件格式用于将数据集输入到CNN模型?
谢谢。
答案 0 :(得分:1)
您可以将每个文件(即图像)存储为数据类型opaque
的HDF5数据集。此外,对于每个数据集,您可以关联一个或多个属性来描述文件(例如,创建时间戳记)。
在Python中使用HDFql,可以这样实现:
import HDFql
HDFql.execute("CREATE FILE images.h5") # create HDF5 file named 'images.h5'
HDFql.execute("USE FILE images.h5") # use (i.e. open) HDF5 file 'images.h5'
HDFql.execute("SHOW FILE my_directory/") # get files (i.e. images) stored in directory 'my_directory' and populate cursor with result
my_cursor = HDFql.Cursor()
i = 1
while HDFql.cursor_next() == HDFql.SUCCESS: # loop through cursor
file_name = HDFql.cursor_get_char()
HDFql.cursor_use(my_cursor)
HDFql.execute("SHOW FILE SIZE my_directory/%s" % file_name)
file_size = HDFql.cursor_get_bigint()
HDFql.cursor_use_default()
dataset_name = "dataset_%04d" % i
HDFql.execute("CREATE DATASET %s AS OPAQUE(%d) VALUES FROM BINARY FILE %s" % (dataset_name, file_size, file_name)) # create HDF5 dataset and write data from file into it
i = i + 1