以下是我从多变量正态分布中绘制的Cython代码。我正在使用循环,因为每次我有不同的密度。 (conLSigma是Cholesky因子)
这需要花费很多时间,因为我正在对每个循环进行逆和Cholesky分解。它比纯Python代码更快,但我想知道是否有任何方法可以提高速度。
from __future__ import division
import numpy as np
cimport numpy as np
ctypedef np.float64_t dtype_t
cimport cython
@cython.boundscheck(False)
@cython.wraparound(False)
def drawMetro(np.ndarray[dtype_t, ndim = 2] beta,
np.ndarray[dtype_t, ndim = 3] H,
np.ndarray[dtype_t, ndim = 2] Sigma,
float s):
cdef int ncons = betas.shape[0]
cdef int nX = betas.shape[1]
cdef int con
cdef np.ndarray betas_cand = np.zeros([ncons, nX], dtype = np.float64)
cdef np.ndarray conLSigma = np.zeros([nX, nX], dtype = np.float64)
for con in xrange(ncons):
conLSigma = np.linalg.cholesky(np.linalg.inv(H[con] + Sigma))
betas_cand[con] = betas[con] + s * np.dot(conLSigma, np.random.standard_normal(size = nX))
return(betas_cand)
答案 0 :(得分:5)
Cholesky分解创建了一个下三角矩阵。这意味着不需要完成np.dot
中接近一半的乘法运算。如果你改变了行
betas_cand[con] = betas[con] + s * np.dot(conLSigma, np.random.standard_normal(size = nX))
到
tmp = np.random.standard_normal(size = nX)
for i in xrange(nX):
for j in xrange(i+1):
betas_cand[con,i] += s * conLSigma[i,j] * tmp[j]
但是,您还需要更改
cdef np.ndarray betas_cand = np.zeros([ncons, nX], dtype = np.float64)
到
cdef np.ndarray betas_cand = np.array(betas)
你当然可以使用切片进行乘法,但我不确定它是否比我建议的方式更快。无论如何,希望你能得到这个想法。我认为你还没有别的办法可以加快速度。
答案 1 :(得分:0)
如何先计算cholesky分解,然后通过反向替换反转下三角矩阵。这应该比linalg.cholesky(linalg.inv(S))更快。