我有一个python 2.7应用程序,我偶尔会打断它。
我正在处理一个非常大的数据文件。为了处理内存限制,我将数据文件划分为由x和y组件标识的网格。每个网格都是独立处理的。
偶尔处理需要很长时间,我需要在某一点停止处理。理想情况下,我想更新y_start和x_start并在我离开的地方恢复应用程序(不处理已经处理过的网格)。
主要操作发生在嵌套的for循环中:
x_start=0.0
x_step=0.05
x_size=10.0
y_start=0.0
y_step=0.05
y_size=10.0
x_ranges = zip(np.arange(x_start,x_size,x_step), np.arange(x_step+x_start,x_size+x_step,x_step))
y_ranges = zip(np.arange(0.0,y_size,y_step), np.arange(y_step,y_size+y_step,y_step))
for x_min,x_max in x_ranges:
for y_min,y_max in y_ranges:
doAction()
在上面的代码中,我处理了x_start。 y_start只应在x_min = x_start时使用。对于x的所有其他值,它应该从0.0开始。
这是我提出的解决方案。是否有更好,更pythonic的方式:
y_ranges_resume = zip(np.arange(y_start,y_size,y_step),np.arange(y_start+y_step,y_size+y_step,y_step)
for x_min,x_max in x_ranges:
if x_min == x_start:
for y_min,y_max in y_ranges_resume:
doAction()
else:
for y_min,y_max in y_ranges:
doAction()
答案 0 :(得分:3)
我不确定更多的pythonic方式,但你可以像这样重写它(真的用任何语言):
y_ranges_resume = zip(np.arange(y_start,y_size,y_step),np.arange(y_start+y_step,y_size+y_step,y_step)
for x_min,x_max in x_ranges:
y_ranges_used = y_ranges
if x_min == x_start:
y_ranges_used = y_ranges_resume
for y_min,y_max in y_ranges_used:
doAction()
至少内部循环只写一次。
或者你可以使用三元组,但我更容易阅读而不是更小的代码。但为了完整起见,你可以这样写出相同的东西:
y_ranges_resume = zip(np.arange(y_start,y_size,y_step),np.arange(y_start+y_step,y_size+y_step,y_step)
for x_min,x_max in x_ranges:
for y_min, y_max in y_ranges_resume if x_min == x_start else y_ranges:
doAction()
答案 1 :(得分:2)
您可以尝试列表理解:
[[doAction() for y_min,y_max in y_ranges_resume] if x_min == x_start else [doAction() for y_min,y_max in y_ranges] for x_min,xmax in x_ranges]
或者您可以使用lambda函数来简化条件
correct_y_range = lambda x : y_ranges_resume if x == x_start else y_ranges
[[doAction() for y_min,y_max in correct_y_range(x_min)] for x_min,x_max in x_ranges]
lambda函数的另一个选项(为了更好的可读性)
correct_y_range = lambda x : y_ranges_resume if x == x_start else y_ranges
for x_min,x_max in x_ranges:
for y_min, y_max in correct_y_range(x_min):
doAction()