我想以编程方式更改与HDF5文件中的数据集关联的数据。我似乎找不到按名称删除数据集的方法(允许我再次使用修改后的数据添加数据集)或按名称更新数据集。我正在使用适用于HDF5 1.6.x的C API,但指向任何HDF5 API的指针都很有用。
答案 0 :(得分:6)
HDF5目前不提供一种简单的机制来从文件中删除数据集或回收已删除对象占用的存储空间。
如此简单的删除似乎是不可能的。但该部分仍在继续:
删除数据集并回收它所使用的空间可以使用
H5Ldelete
函数和h5repack
实用程序完成。使用H5Ldelete
函数,可以从文件结构中删除指向数据集的链接。删除所有链接后,任何应用程序都无法访问数据集,并且有效地从文件中删除了该数据集。恢复未链接数据集占用空间的方法是将文件的所有对象写入新文件。应用程序无法访问任何未链接的对象,并且不会将其包含在新文件中。可以使用自定义程序或h5repack
实用程序将对象写入新文件。
答案 1 :(得分:2)
如果要在c ++中删除数据集,则需要以下命令:
H5File m_h5File (pathAndNameToHDF5File, H5F_ACC_RDWR); //The hdf5 c++ object.
std::string channelName = "/myGroup/myDataset";
int result = H5Ldelete(m_h5File.getId(), channelName.data(), H5P_DEFAULT);
如果成功,结果将是非负值;否则返回负值。 https://support.hdfgroup.org/HDF5/doc/RM/RM_H5L.html#Link-Delete
正如@MaxLybbert所说,硬盘空间并没有恢复。您必须使用重新包装工具。 但是,使用HDF5 v.1.10可以恢复空间。但是用户指南还没有准备好:https://support.hdfgroup.org/HDF5/docNewFeatures/NewFeaturesFileSpaceMgmtDocs.html