标签: pandas
我正在将存储在磁盘上的数据框作为HDF5文件加载。我正在使用store.select语句运行条件并仅返回我感兴趣的数据。之后我得到了数据的列式方法。有没有办法将两个步骤结合起来,使得平均值基本上在磁盘上执行,并且整个数据不会同时加载到内存中?
谢谢! -Kaushik
答案 0 :(得分:1)
理论上是的,请参阅here。在实践中,不是在此刻。您必须使用store._handle下拉到pytables以获取所需的数据。例如,您还必须处理nan。
store._handle
nan