标签: python pandas hdfstore
我有一个大型数据集(> 100M行),我已经放入HDF商店进行Pandas分析。它太大而无法满足记忆的需要。我希望能够在数据集的setup字段中选择具有最大或最小日期时间值的行。
setup
所以,类似于
df.ix[df['setup'].idxmax()]
如果整个数据集都在内存中。有什么建议吗?