在HDF文件中更新一个字段

时间:2017-09-06 17:45:29

标签: python hdf5 h5py

我似乎无法让这个工作。所有示例和线程都有人创建新数据集。我只想更新已创建的数据集中的一个字段。

这就是我所拥有的:

h5_file = h5py.File(event_file_path, "r+") #this works

event_processing_status = int(h5_file[PATH][STATUS].value[0]['Status']) #this works
print({"{0:b}".format(event_processing_status)) #this works
event_processing_status = (event_processing_status | STATUS_UPDATE) #this works
h5_file[PATH][STATUS].value[0]['Status'] = event_processing_status #updating???, no error
event_processing_status = int(h5_file[PATH][STATUS].value[0]['Status']) #this works
print({"{0:b}".format(event_processing_status)) #not the update value

h5_file.close()

我做错了什么?

更多信息: 数据集列的dtypes:

dset = h5_file[PATH][STATUS] 
print(dset.dtype) gives:
[('Status', '<u8'), ('Segments', '<u4'), ('Characterized', '<u4'), ('More_Segments', '<u4'), ('ID', '<i4'), ('Releases', '<u2'), ('Type', '|u1'), ('Track', '<i4')]

dset[0,'Status'] = event_processing_status gives:
TypeError: Field name selections are not allowed for write.

2 个答案:

答案 0 :(得分:1)

跟进我的评论,假设您的数据集是结构化/复合dtype

-fsanitize=signed-integer-overflow

使用数据创建数据集

In [144]: f = h5py.File('test.h5','w')
In [145]: arr = np.ones((3,), dtype='i,f')  # structured array
In [146]: arr
Out[146]: 
array([(1,  1.), (1,  1.), (1,  1.)],
      dtype=[('f0', '<i4'), ('f1', '<f4')])

我可以用记录ID和字段名索引它;这不适用于In [147]: ds = f.create_dataset('arr',data=arr) In [148]: ds Out[148]: <HDF5 dataset "arr": shape (3,), type "|V8"> In [149]: ds.value Out[149]: array([(1, 1.), (1, 1.), (1, 1.)], dtype=[('f0', '<i4'), ('f1', '<f4')]) ds.value

arr

我可以使用单独的记录和字段条目进行索引;但不能以这种方式改变价值观:

In [151]: ds[0,'f0']
Out[151]: 1
In [152]: ds[0,'f0'] = 2    # and I can assign values
In [153]: ds.value
Out[153]: 
array([(2,  1.), (1,  1.), (1,  1.)],
      dtype=[('f0', '<i4'), ('f1', '<f4')])

分配需要合并索引

In [154]: ds[0]['f1']
Out[154]: 1.0
In [155]: ds[0]['f1'] = 234
In [156]: ds.value
Out[156]: 
array([(2,  1.), (1,  1.), (1,  1.)],
      dtype=[('f0', '<i4'), ('f1', '<f4')])
In [157]: ds['f1'][0] = 234
In [158]: ds.value
Out[158]: 
array([(2,  1.), (1,  1.), (1,  1.)],
      dtype=[('f0', '<i4'), ('f1', '<f4')])

答案 1 :(得分:1)

这就是我必须做的事情:

h5_file = h5py.File(event_file_path, "r+") #this works

#Retrieve the dataset containing Event_Status
data= h5_file[PATH][STATUS]

#Get the Event_Status (np.array)
event_status = data['Event_Status']

#Update the value of Event_Status
event_status[0] = np.bitwise_or(event_status[0],np.uint64(STATUS_UPDATE))

#Write updated value to file
elements = data[0]
elements['Event_Status'] = event_status
data[0] = elements

h5_file.close()