从hdf5应用函数中选择(例如均值)

时间:2013-11-15 15:30:00

标签: pandas

我正在将存储在磁盘上的数据框作为HDF5文件加载。我正在使用store.select语句运行条件并仅返回我感兴趣的数据。之后我得到了数据的列式方法。有没有办法将两个步骤结合起来,使得平均值基本上在磁盘上执行,并且整个数据不会同时加载到内存中?

谢谢! -Kaushik

1 个答案:

答案 0 :(得分:1)

理论上是的,请参阅here。在实践中,不是在此刻。您必须使用store._handle下拉到pytables以获取所需的数据。例如,您还必须处理nan