如何将图像文件夹转换为h5文件?

时间:2020-02-25 15:23:32

标签: python hdf5

如何将图像文件夹转换为h5文件?还是有其他类型的文件格式用于将数据集输入到CNN模型?

谢谢。

1 个答案:

答案 0 :(得分:1)

您可以将每个文件(即图像)存储为数据类型opaque的HDF5数据集。此外,对于每个数据集,您可以关联一个或多个属性来描述文件(例如,创建时间戳记)。

在Python中使用HDFql,可以这样实现:

import HDFql

HDFql.execute("CREATE FILE images.h5") # create HDF5 file named 'images.h5'

HDFql.execute("USE FILE images.h5") # use (i.e. open) HDF5 file 'images.h5'

HDFql.execute("SHOW FILE my_directory/") # get files (i.e. images) stored in directory 'my_directory' and populate cursor with result

my_cursor = HDFql.Cursor()

i = 1
while HDFql.cursor_next() == HDFql.SUCCESS: # loop through cursor

   file_name = HDFql.cursor_get_char()

   HDFql.cursor_use(my_cursor)

   HDFql.execute("SHOW FILE SIZE my_directory/%s" % file_name)

   file_size = HDFql.cursor_get_bigint()

   HDFql.cursor_use_default()

   dataset_name = "dataset_%04d" % i

   HDFql.execute("CREATE DATASET %s AS OPAQUE(%d) VALUES FROM BINARY FILE %s" % (dataset_name, file_size, file_name)) # create HDF5 dataset and write data from file into it

   i = i + 1