我有一个非常耗时的程序,它使用pandas。幸运的是,它只是吐出信息,并没有影响任何用户体验。话虽这么说,一直调试和重新运行真的很痛苦。
据我所知,嵌套for循环可能会导致大部分性能下降,但由于我需要所有可能的排列,这是不可避免的。我正在寻找的是从我的计划中挤出一些更好的表现的任何其他方法。例如,我可以使用更高效的pandas / datframe成语吗?
程序看起来像这样:
dict = {}
for w_id in range(1,6):
for x_id in range(1,26):
for y_id in range(1,12):
for z_id in range(1,6):
#create a query based on id's and assign it to, lets say df1
#assign a special combo of id's as df1's index
dict[row_id] = df
df_foo = pd.concat(dict)
df_foo = df_foo.groupby(level = 0).describe().to_csv