存储许多结果数据帧的有效方法,这些数据帧已从较大的数据帧中分离出来

时间:2016-04-16 15:03:12

标签: python loops pandas vector dataframe

我有一个非常大的pandas数据帧,我根据两个特定列中的值分成许多较小的数据帧。是否有更有效的方法来存储这些不涉及循环的数据帧?这就是我现在所拥有的:

df_list=[]
grouped=df.groupby(['column1', 'column2'], as_index = False)
for l,g in grouped:
    df_list.append(g)

原始df中有超过700,000行,我猜测超过100,000个数据帧。我现在使用的方法大约需要5分钟。我正在寻找一种存储不涉及循环的数据帧的方法。

0 个答案:

没有答案