我有一个非常大的pandas数据帧,我根据两个特定列中的值分成许多较小的数据帧。是否有更有效的方法来存储这些不涉及循环的数据帧?这就是我现在所拥有的:
df_list=[]
grouped=df.groupby(['column1', 'column2'], as_index = False)
for l,g in grouped:
df_list.append(g)
原始df中有超过700,000行,我猜测超过100,000个数据帧。我现在使用的方法大约需要5分钟。我正在寻找一种存储不涉及循环的数据帧的方法。