Question

我有一个非常耗时的程序，它使用pandas。幸运的是，它只是吐出信息，并没有影响任何用户体验。话虽这么说，一直调试和重新运行真的很痛苦。

据我所知，嵌套for循环可能会导致大部分性能下降，但由于我需要所有可能的排列，这是不可避免的。我正在寻找的是从我的计划中挤出一些更好的表现的任何其他方法。例如，我可以使用更高效的pandas / datframe成语吗？

程序看起来像这样：

dict = {} 
   for w_id in range(1,6):
        for x_id in range(1,26):
            for y_id in range(1,12):
                for z_id in range(1,6):


                    #create a query based on id's and assign it to, lets say df1
                    #assign a special combo of id's as df1's index
                    dict[row_id] = df

df_foo = pd.concat(dict)

df_foo = df_foo.groupby(level = 0).describe().to_csv

如何在Pandas中运行更高效的程序

0 个答案: