我正在尝试读取SVHN数据集(http://ufldl.stanford.edu/housenumbers/)[完整版本]。它是hdf5,所以我尝试使用h5py(因为熊猫需要一段时间才能读取它)。
因此,我尝试了https://stackoverflow.com/a/41579641/1745291中描述的方法,但是在我的系统上(最新的Archlinux,h5py 2.8.0
,hdf5 1.10.2-3
,Intel(R)CoreTM i7-7700 CPU @ 3.60GHz),读取单个文件名的速度超慢:> 30秒...
此版本有错误吗?是预期的访问时间吗? (因为这种格式享有盛誉,所以很难相信)...我做错什么了吗?
...注意:我还发现此线程没有响应:https://groups.google.com/forum/#!topic/h5py/4eHydpsQ1HU