如何在另一个np.where中使用np.where(续:光线跟踪)

时间:2019-05-16 03:28:03

标签: python-3.x numpy optimization geometry

问题是:如何在同一条语句中使用两个np.where,就像这样(过于简化):

np.where((ndarr1==ndarr2),np.where((ndarr1+ndarr2==ndarr3),True,False),False)

如果未达到第一个条件语句,则避免计算第二个条件语句。

我的第一个目标是找到三角形中光线的交点(如果有)。此问题可以通过以下算法解决(位于stackoverflow上):

def intersect_line_triangle(q1,q2,p1,p2,p3):
    def signed_tetra_volume(a,b,c,d):
        return np.sign(np.dot(np.cross(b-a,c-a),d-a)/6.0)

    s1 = signed_tetra_volume(q1,p1,p2,p3)
    s2 = signed_tetra_volume(q2,p1,p2,p3)

    if s1 != s2:
        s3 = signed_tetra_volume(q1,q2,p1,p2)
        s4 = signed_tetra_volume(q1,q2,p2,p3)
        s5 = signed_tetra_volume(q1,q2,p3,p1)
        if s3 == s4 and s4 == s5:
           n = np.cross(p2-p1,p3-p1)
           t = np.dot(p1-q1,n) / np.dot(q2-q1,n)
           return q1 + t * (q2-q1)
    return None

以下是两个条件语句:

  1. s1!= s2
  2. s3 == s4&s4 == s5

现在,由于我要检查> 20k个三角形,因此我想同时在所有三角形上应用此功能。

第一个解决方案是:

s1 = vol(r0,tri[:,0,:],tri[:,1,:],tri[:,2,:])
s2 = vol(r1,tri[:,0,:],tri[:,1,:],tri[:,2,:])

s3 = vol(r1,r2,tri[:,0,:],tri[:,1,:])
s4 = vol(r1,r2,tri[:,1,:],tri[:,2,:])
s5 = vol(r1,r2,tri[:,2,:],tri[:,0,:])

np.where((s1!=s2) & (s3+s4==s4+s5),intersect(),False)

其中s1,s2,s3,s4,s5是包含每个三角形的值S的数组。问题是,这意味着我必须为所有三角形计算s3,s4和s5。

现在理想的情况是仅在语句1为True时才计算语句2(和s3,s4,s5),如下所示:

check= np.where((s1!=s2),np.where((compute(s3)==compute(s4)) & (compute(s4)==compute(s5), compute(intersection),False),False)

(为简化说明,我只说了“计算”而不是整个计算过程。在这里,“计算”仅适用于适当的三角形)。

现在该选项当然不起作用(计算s4两次),但是我很乐意对类似的过程提出一些建议

2 个答案:

答案 0 :(得分:0)

这是我使用屏蔽数组来回答此问题的方式:

    loTrue= np.where((s1!=s2),False,True)
    s3=ma.masked_array(np.sign(dot(np.cross(r0r1, r0t0), r0t1)),mask=loTrue)
    s4=ma.masked_array(np.sign(dot(np.cross(r0r1, r0t1), r0t2)),mask=loTrue)
    s5=ma.masked_array(np.sign(dot(np.cross(r0r1, r0t2), r0t0)),mask=loTrue)
    loTrue= ma.masked_array(np.where((abs(s3-s4)<1e-4) & ( abs(s5-s4)<1e-4),True,False),mask=loTrue)

    #also works when computing s3,s4 and s5 inside loTrue, like this:        
    loTrue= np.where((s1!=s2),False,True)
    loTrue= ma.masked_array(np.where(
            (abs(np.sign(dot(np.cross(r0r1, r0t0), r0t1))-np.sign(dot(np.cross(r0r1, r0t1), r0t2)))<1e-4) &
            (abs(np.sign(dot(np.cross(r0r1, r0t2), r0t0))-np.sign(dot(np.cross(r0r1, r0t1), r0t2)))<1e-4),True,False)
            ,mask=loTrue)

请注意,当不使用这种方法时,相同的过程是这样完成的:

    s3= np.sign(dot(np.cross(r0r1, r0t0), r0t1)  /6.0)
    s4= np.sign(dot(np.cross(r0r1, r0t1), r0t2)  /6.0)
    s5= np.sign(dot(np.cross(r0r1, r0t2), r0t0)  /6.0)
    loTrue= np.where((s1!=s2) & (abs(s3-s4)<1e-4) & ( abs(s5-s4)<1e-4) ,True,False)

两者都给出相同的结果,但是,仅在此过程中循环进行10k迭代时,不使用掩码数组会更快! (不带掩码数组的时间为26秒,带掩码数组的时间为31秒,仅在一行中使用带掩码的数组时为33秒(不分别计算s3,s4和s5,或之前不计算s4)。

结论:这里解决了使用嵌套数组的问题(请注意,掩码指示了将不计算掩码的位置,因此,在验证条件时,必须将第一个loTri设置为False(0))。但是,在这种情况下,速度并不快。

答案 1 :(得分:0)

我可以从短路中获得小幅加速,但是我不认为值得额外的管理员。

full computation 4.463818839867599 ms per iteration (one ray, 20,000 triangles)
short ciruciting 3.0060838296776637 ms per iteration (one ray, 20,000 triangles)

代码:

import numpy as np

def ilt_cut(q1,q2,p1,p2,p3):
    qm = (q1+q2)/2
    qd = qm-q2
    p12 = p1-p2
    aux = np.cross(qd,q2-p2)
    s3 = np.einsum("ij,ij->i",aux,p12)
    s4 = np.einsum("ij,ij->i",aux,p2-p3)
    ge = (s3>=0)&(s4>=0)
    le = (s3<=0)&(s4<=0)
    keep = np.flatnonzero(ge|le)
    aux = p1[keep]
    qpm1 = qm-aux
    p31 = p3[keep]-aux
    s5 = np.einsum("ij,ij->i",np.cross(qpm1,p31),qd)
    ge = ge[keep]&(s5>=0)
    le = le[keep]&(s5<=0)
    flt = np.flatnonzero(ge|le)
    keep = keep[flt]
    n = np.cross(p31[flt], p12[keep])
    s12 = np.einsum("ij,ij->i",n,qpm1[flt])
    flt = np.abs(s12) <= np.abs(s3[keep]+s4[keep]+s5[flt])
    return keep[flt],qm-(s12[flt]/np.einsum("ij,ij->i",qd,n[flt]))[:,None]*qd

def ilt_full(q1,q2,p1,p2,p3):
    qm = (q1+q2)/2
    qd = qm-q2
    p12 = p1-p2
    qpm1 = qm-p1
    p31 = p3-p1
    aux = np.cross(qd,q2-p2)
    s3 = np.einsum("ij,ij->i",aux,p12)
    s4 = np.einsum("ij,ij->i",aux,p2-p3)
    s5 = np.einsum("ij,ij->i",np.cross(qpm1,p31),qd)
    n = np.cross(p31, p12)
    s12 = np.einsum("ij,ij->i",n,qpm1)
    ge = (s3>=0)&(s4>=0)&(s5>=0)
    le = (s3<=0)&(s4<=0)&(s5<=0)
    keep = np.flatnonzero((np.abs(s12) <= np.abs(s3+s4+s5)) & (ge|le))
    return keep,qm-(s12[keep]/np.einsum("ij,ij->i",qd,n[keep]))[:,None]*qd

tri = np.random.uniform(1, 10, (20_000, 3, 3))
p0, p1 = np.random.uniform(1, 10, (2, 3))

from timeit import timeit
A,B,C = tri.transpose(1,0,2)
print('full computation', timeit(lambda: ilt_full(p0[None], p1[None], A, B, C), number=100)*10, 'ms per iteration (one ray, 20,000 triangles)')
print('short ciruciting', timeit(lambda: ilt_cut(p0[None], p1[None], A, B, C), number=100)*10, 'ms per iteration (one ray, 20,000 triangles)')

请注意,我在算法上有些过分,所以可能不会在每种情况下都得到与您相同的结果。

我更改了:

  • 我内联了tetra的体积,这样可以节省一些重复的子计算
  • 我用射线的中点M替换了一个射线末端。这样可以节省计算一个四边形体积(s1s2的时间,因为可以通过比较四边形ABCM的体积和{{1}的总和来检查射线是否穿过三角形ABC平面},s3s4(如果它们具有相同的符号)。