我正在使用一些嵌套循环来分析一些遗传算法代码,并且从我看到的大部分时间花在我的两个函数中,这些函数涉及切片和添加numpy数组。我尽力进一步优化它们,但是想看看其他人是否提出了想法。
第一个函数被称为2954684次,在19秒的函数内花费的总时间
我们基本上只是根据数据[1]中包含的坐标在数据[0]中包含的numpy数组中创建视图
def get_signal(data, options):
#data[0] contains bed, data[1] contains position
#forward = 0, reverse = 1
start = data[1][0] - options.halfwinwidth
end = data[1][0] + options.halfwinwidth
if data[1][1] == 0:
normals_forward = data[0]['normals_forward'][start:end]
normals_reverse = data[0]['normals_reverse'][start:end]
else:
normals_forward = data[0]['normals_reverse'][end - 1:start - 1: -1]
normals_reverse = data[0]['normals_forward'][end - 1:start - 1: -1]
row = {'normals_forward': normals_forward,
'normals_reverse': normals_reverse,
}
return row
在函数内花费的总时间为13.674秒,调用了857次:
signal是一个等长的numpy数组列表,其中dtype为float,options只是随机选项
该函数的目标只是将每个numpy数组的列表添加到单个数组中,计算由正向和反向数组形成的两条曲线的交集并返回结果
def calculate_signal(signal, options):
profile_normals_forward = np.zeros(options.halfwinwidth * 2, dtype='f')
profile_normals_reverse = np.zeros(options.halfwinwidth * 2, dtype='f')
#here i tried np.sum over axis = 0, its significantly slower than the for loop approach
for b in signal:
profile_normals_forward += b['normals_forward']
profile_normals_reverse += b['normals_reverse']
count = len(signal)
if options.normalize == 1:
#print "Normalizing to max counts"
profile_normals_forward /= max(profile_normals_forward)
profile_normals_reverse /= max(profile_normals_reverse)
elif options.normalize == 2:
#print "Normalizing to number of elements"
profile_normals_forward /= count
profile_normals_reverse /= count
intersection_signal = np.fmin(profile_normals_forward, profile_normals_reverse)
intersection = np.sum(intersection_signal)
results = {"intersection": intersection,
"profile_normals_forward": profile_normals_forward,
"profile_normals_reverse": profile_normals_reverse,
}
return results
正如你所看到的那两个非常简单,但是占了> 60%的执行时间在一个可以运行数小时/天的脚本上(遗传算法优化),所以即使是微小的改进也是值得欢迎的:)
答案 0 :(得分:2)
我想提高第一个函数的速度的一个简单方法是使用不同的表示法来访问列表索引,如详细here。
例如:
foo = numpyArray[1][0]
bar = numpyArray[1,0]
第二行的执行速度要快得多,因为您不必在numpyArray[1]
返回整个元素,然后找到它的第一个元素。试一试