我有几个大文件集的HDF5文件,我正在寻找一种有效的方法将这些文件中的数据转换为XML,TXT或其他一些易于阅读的格式。我尝试使用Python包(www.h5py.org),但我无法弄清楚任何方法,我可以足够快地完成这些工作。我不仅限于Python,还可以使用Java,Scala或Matlab编写代码。有人可以就如何处理这个问题给我一些建议吗?
谢谢,
TM
答案 0 :(得分:8)
Mathias711的方法是最直接的方法。如果你想在python中做,那么使用pandas.HDFStore:
from pandas import HDFStore
store = HDFStore('inputFile.hd5')
store['table1Name'].to_csv('outputFileForTable1.csv')
答案 1 :(得分:5)
您可以使用h5dump -o dset.asci -y -w 400 dset.h5
-o dset.asci
指定输出文件-y -w 400
指定尺寸大小乘以打印每个值所需的位置数和间距数。你应该在这里采取一个非常大的数字。dset.h5
当然是您要转换的hdf5文件我认为这是将其转换为ascii文件的最简单方法,您可以将其导入excel或任何您想要的内容。我做了几次,它对我有用。我从this网站获取了他的信息。