到目前为止,我从来没有关心过这个问题,但现在我需要使用一些需要由PyOpenGL缓冲的大量顶点,而python迭代似乎是瓶颈。情况就是这样。我有一个3D点vertices
数组,在每一步我必须为每个顶点计算一个4D颜色数组。到目前为止,我的方法是:
upper_border = len(self.vertices) / 3
#Only generate at first step, otherwise use old one and replace values
if self.color_array is None:
self.color_array = numpy.empty(4 * upper_border)
for i in range(upper_border):
#Obtain a color between a start->end color
diff_activity = (activity[i] - self.min) / abs_diff
clr_idx = i * 4
self.color_array[clr_idx] = start_colors[0] + diff_activity * end_colors[0]
self.color_array[clr_idx + 1] = start_colors[1] + diff_activity * end_colors[1]
self.color_array[clr_idx + 2] = start_colors[2] + diff_activity * end_colors[2]
self.color_array[clr_idx + 3] = 1
现在我认为我无法做任何其他事情来消除循环每一步的操作,但我猜测必须有一种更优化的性能方式来完成循环。我是这么说的,因为在javascript中,例如,相同的微积分产生9FPS,而在Python中,我只获得2-3 FPS。
此致 波格丹
答案 0 :(得分:12)
要快速创建此代码,您需要“向量化”它:使用NumPy的boradcasting规则,通过隐式循环替换所有显式Python循环。我可以尝试给你的循环的矢量化版本:
if self.color_array is None:
self.color_array = numpy.empty((len(activity), 4))
diff_activity = (activity - self.min) / abs_diff
self.color_array[:, :3] = (start_colors +
diff_activity[:, numpy.newaxis] +
end_colors)
self.color_array[:, 3] = 1
请注意,我不得不做很多猜测,因为我不确定你的所有变量是什么以及代码应该做什么,所以我不能保证这个代码运行。我将color_array
变成了一个二维数组,因为这似乎更合适。这可能需要更改代码的其他部分(或者您需要再次展平数组)。
我假设self.min
和abs_diff
是标量,所有其他名称都引用了以下形状的NumPy数组:
activity.shape == (len(vertices) // 3,)
start_colors.shape == (3,)
end_colors.shape == (3,)
它看起来好像vertices
是一维数组,应该是一个二维数组。
答案 1 :(得分:6)
self.color_array
4次,尝试在循环之前创建局部变量,并将其用于循环:local_array = self.color_array
start_colors[N]
和end_colors[N]
:start_color_0 = start_colors[0]
尝试使用list.extend()来减少循环中的行:
local_array.extend([
start_colors_0 + diff_activity * end_colors_0,
start_colors_1 + diff_activity * end_colors_1,
start_colors_2 + diff_activity * end_colors_2,
1
])