应用错误收集

存储许多结果数据帧的有效方法，这些数据帧已从较大的数据帧中分离出来

时间：2016-04-16 15:03:12

标签： python loops pandas vector dataframe

我有一个非常大的pandas数据帧，我根据两个特定列中的值分成许多较小的数据帧。是否有更有效的方法来存储这些不涉及循环的数据帧？这就是我现在所拥有的：

df_list=[]
grouped=df.groupby(['column1', 'column2'], as_index = False)
for l,g in grouped:
    df_list.append(g)

原始df中有超过700,000行，我猜测超过100,000个数据帧。我现在使用的方法大约需要5分钟。我正在寻找一种存储不涉及循环的数据帧的方法。

0 个答案:

没有答案