我正在对包含原始数据的一个数据帧进行一些聚合,然后将聚合的数据插入到另一个数据帧(即op)中。我只是通过更改聚合参数来数百次调用以下函数。如下所示-
def countByTwoSubGroupsForHouseHoldT(df,s1,s2,indicator,dimension):
dd=df.groupby(['RV_name',s1,s2])['combined'].count().reset_index()
for i in dd.index:
op.loc[len(op)] =[indicator,'Number',str(dd.get_value(i,s1))+'-'+str(dd.get_value(i,s2)),dd.get_value(i,'RV_name'),'t1',dd.get_value(i,'combined'),dimension]
由于数据量巨大,因此需要花费大量时间。有一个更好的方法吗?谢谢