如何在Pandas中运行更高效的程序

时间:2017-04-05 04:34:20

标签: python pandas

我有一个非常耗时的程序,它使用pandas。幸运的是,它只是吐出信息,并没有影响任何用户体验。话虽这么说,一直调试和重新运行真的很痛苦。

据我所知,嵌套for循环可能会导致大部分性能下降,但由于我需要所有可能的排列,这是不可避免的。我正在寻找的是从我的计划中挤出一些更好的表现的任何其他方法。例如,我可以使用更高效的pandas / datframe成语吗?

程序看起来像这样:

dict = {} 
   for w_id in range(1,6):
        for x_id in range(1,26):
            for y_id in range(1,12):
                for z_id in range(1,6):


                    #create a query based on id's and assign it to, lets say df1
                    #assign a special combo of id's as df1's index
                    dict[row_id] = df

df_foo = pd.concat(dict)

df_foo = df_foo.groupby(level = 0).describe().to_csv

0 个答案:

没有答案