我正在尝试为我的HDF5文件增加缓存大小,但它似乎没有起作用。 这就是我所拥有的:
import h5py
with h5py.File("test.h5", 'w') as fid:
# cache settings of file
cacheSettings = list(fid.id.get_access_plist().get_cache())
print cacheSettings
# increase cache
cacheSettings[2] = int(5 * cacheSettings[2])
print cacheSettings
# read cache settings from file
fid.id.get_access_plist().set_cache(*cacheSettings)
print fid.id.get_access_plist().get_cache()
这是输出:
[0, 521, 1048576, 0.75]
[0, 521, 5242880, 0.75]
(0, 521, 1048576, 0.75)
任何想法为什么阅读有效,但设置没有? 关闭并重新打开文件似乎也无济于事。
答案 0 :(得分:8)
根据the docs,get_access_plist()
会返回文件访问属性列表的副本。因此,修改副本不会影响原始版本也就不足为奇了。
高级界面似乎没有提供更改缓存设置的方法。
以下是使用低级接口的方法。
propfaid = h5py.h5p.create(h5py.h5p.FILE_ACCESS)
settings = list(propfaid.get_cache())
print(settings)
# [0, 521, 1048576, 0.75]
settings[2] *= 5
propfaid.set_cache(*settings)
settings = propfaid.get_cache()
print(settings)
# (0, 521, 5242880, 0.75)
以上创建了PropFAID。然后我们可以打开文件并以这种方式获得FileID:
import contextlib
with contextlib.closing(h5py.h5f.open(
filename, flags=h5py.h5f.ACC_RDWR, fapl=propfaid)) as fid:
# <h5py.h5f.FileID object at 0x9abc694>
settings = list(fid.get_access_plist().get_cache())
print(settings)
# [0, 521, 5242880, 0.75]
我们可以使用fid
通过将fid
传递给h5py.File
来使用高级界面打开文件:
f = h5py.File(fid)
print(f.id.get_access_plist().get_cache())
# (0, 521, 5242880, 0.75)
因此,您仍然可以使用高级接口,但需要一些 摆弄到那里。另一方面,如果你把它提炼成必需品,也许它不是那么糟糕:
import h5py
import contextlib
filename = '/tmp/foo.hdf5'
propfaid = h5py.h5p.create(h5py.h5p.FILE_ACCESS)
settings = list(propfaid.get_cache())
settings[2] *= 5
propfaid.set_cache(*settings)
with contextlib.closing(h5py.h5f.open(filename, fapl=propfaid)) as fid:
f = h5py.File(fid)
答案 1 :(得分:2)
从h5py版本2.9.0开始,现在可以直接通过主h5py.File
界面使用此行为。记录了here的三个参数可控制“原始数据块缓存” — rdcc_nbytes
,rdcc_w0
和rdcc_nslots
。 OP正在尝试调整rdcc_nbytes
设置,现在可以简单地将其设置为
import h5py
with h5py.File("test.h5", "w", rdcc_nbytes=5242880) as fid:
# Use fid for something here
唯一的区别是您必须知道实际需要多少空间,而不是像OP希望的那样乘以5。当前的默认值与找到的OP相同。当然,如果您真的想以编程方式执行此操作,则只需打开一次,获取缓存,将其关闭,然后使用所需的参数重新打开即可。
答案 2 :(得分:1)
h5py-cache项目可能会有所帮助,虽然我没有使用它:
import h5py_cache
with h5py_cache.File('test.h5', chunk_cache_mem_size=1024**3, 'a') as f:
f.create_dataset(...)