用于生成矢量值的函​​数的矢量化代码

时间:2017-01-07 12:44:43

标签: python performance numpy vectorization

假设我们有一个如下定义的函数,我们希望iterate over n from 1 to L,我对矢量化代码的影响很大,因为这个代码相当慢,因为需要在外部调用for循环这个功能。

详细信息:L, K是大整数,例如1000和H_n是浮点值。

def multifrac_Brownian_motion(n, L, K, list_hurst, ind_hurst):

    t_ks = np.asarray(sorted(-np.array(range(1, K + 1))*(1./L)))

    t_ns = np.linspace(0, 1, num=L+1)
    t_n = t_ns[n]

    chi_k = np.random.randn(K)
    chi_lminus1 = np.random.randn(L)

    H_n = get_hurst_value(t_n, list_hurst, ind_hurst)

    part1 = 1./(np.random.gamma(0.5 + H_n))

    sums1 = np.dot((t_n - t_ks)**(H_n - 0.5) - ((-t_ks)**(H_n - 0.5)), chi_k)
    sums2 = np.dot((t_n - t_ns[:n])**(H_n - 0.5), chi_lminus1[:n])

    return part1*(1./np.sqrt(L))*(sums1 + sums2)

for n in range(1, L + 1):
        onelist.append(multifrac_Brownian_motion(n, L, K, list_hurst, ind_hurst=ind_hurst))

更新

def list_hurst_funcs(M, seg_size=10):
    """Generate a list of Hurst function components

    Args:
        M: Int, number of hurst functions
        seg_size: Int, number of segmentations of interval [0, 1]
    Returns:
        list_hurst: List, list of hurst function components
    """

    list_hurst = []

    for i in range(M):
        seg_points = sorted(np.random.uniform(size=seg_size))
        funclist = np.random.uniform(size=seg_size + 1)
        list_hurst.append((seg_points, funclist))

    return list_hurst


def get_hurst_value(x, list_hurst, ind):
    if np.isscalar(x):
        x = np.array(float(x), ndmin=1)

    seg_points, funclist = list_hurst[ind]

    condlist = [x < seg_points[0]] +\
                [(x >= seg_points[s] and x < seg_points[s + 1]) 
                                          for s in range(len(seg_points) - 1)] +\
                [x >= seg_points[-1]]

    return np.piecewise(x, condlist=condlist, funclist=funclist)

1 个答案:

答案 0 :(得分:0)

解决这类问题的一种方法是(尝试)了解大局,并采用不同的方法将所有内容视为2d或更大(LxK阵列)。另一种方法是检查multifrac_Brownian_motion,试图加快速度,并在可能的情况下消除依赖于标量或1d数组的步骤。换句话说,从内到外工作。如果我们得到足够的速度提升,那么我们必须在循环中调用它并不重要。更好的是,这种改进提出了在高维度上运作的方式。

作为从内到外的开始,我建议将t_ks calc替换为:

t_ks = -np.arange(K,0,-1)/L    # 1./L if required by Py2 integer division

由于list_hurstind_hurst对于所有n都相同,我怀疑您可以在循环外移动一些耗时get_hurst_value的部分。

但我会尽最大努力改善condlist建设。这个列表理解深埋在你的外环中。

piecewise也会循环播放seg_points