Question

问题是：如何在同一条语句中使用两个np.where，就像这样（过于简化）：

np.where((ndarr1==ndarr2),np.where((ndarr1+ndarr2==ndarr3),True,False),False)

如果未达到第一个条件语句，则避免计算第二个条件语句。

我的第一个目标是找到三角形中光线的交点（如果有）。此问题可以通过以下算法解决（位于stackoverflow上）：

def intersect_line_triangle(q1,q2,p1,p2,p3):
    def signed_tetra_volume(a,b,c,d):
        return np.sign(np.dot(np.cross(b-a,c-a),d-a)/6.0)

    s1 = signed_tetra_volume(q1,p1,p2,p3)
    s2 = signed_tetra_volume(q2,p1,p2,p3)

    if s1 != s2:
        s3 = signed_tetra_volume(q1,q2,p1,p2)
        s4 = signed_tetra_volume(q1,q2,p2,p3)
        s5 = signed_tetra_volume(q1,q2,p3,p1)
        if s3 == s4 and s4 == s5:
           n = np.cross(p2-p1,p3-p1)
           t = np.dot(p1-q1,n) / np.dot(q2-q1,n)
           return q1 + t * (q2-q1)
    return None

以下是两个条件语句：

s1！= s2
s3 == s4＆s4 == s5

现在，由于我要检查> 20k个三角形，因此我想同时在所有三角形上应用此功能。

第一个解决方案是：

s1 = vol(r0,tri[:,0,:],tri[:,1,:],tri[:,2,:])
s2 = vol(r1,tri[:,0,:],tri[:,1,:],tri[:,2,:])

s3 = vol(r1,r2,tri[:,0,:],tri[:,1,:])
s4 = vol(r1,r2,tri[:,1,:],tri[:,2,:])
s5 = vol(r1,r2,tri[:,2,:],tri[:,0,:])

np.where((s1!=s2) & (s3+s4==s4+s5),intersect(),False)

其中s1，s2，s3，s4，s5是包含每个三角形的值S的数组。问题是，这意味着我必须为所有三角形计算s3，s4和s5。

现在理想的情况是仅在语句1为True时才计算语句2（和s3，s4，s5），如下所示：

check= np.where((s1!=s2),np.where((compute(s3)==compute(s4)) & (compute(s4)==compute(s5), compute(intersection),False),False)

（为简化说明，我只说了“计算”而不是整个计算过程。在这里，“计算”仅适用于适当的三角形）。

现在该选项当然不起作用（计算s4两次），但是我很乐意对类似的过程提出一些建议

Answer 1

这是我使用屏蔽数组来回答此问题的方式：

    loTrue= np.where((s1!=s2),False,True)
    s3=ma.masked_array(np.sign(dot(np.cross(r0r1, r0t0), r0t1)),mask=loTrue)
    s4=ma.masked_array(np.sign(dot(np.cross(r0r1, r0t1), r0t2)),mask=loTrue)
    s5=ma.masked_array(np.sign(dot(np.cross(r0r1, r0t2), r0t0)),mask=loTrue)
    loTrue= ma.masked_array(np.where((abs(s3-s4)<1e-4) & ( abs(s5-s4)<1e-4),True,False),mask=loTrue)

    #also works when computing s3,s4 and s5 inside loTrue, like this:        
    loTrue= np.where((s1!=s2),False,True)
    loTrue= ma.masked_array(np.where(
            (abs(np.sign(dot(np.cross(r0r1, r0t0), r0t1))-np.sign(dot(np.cross(r0r1, r0t1), r0t2)))<1e-4) &
            (abs(np.sign(dot(np.cross(r0r1, r0t2), r0t0))-np.sign(dot(np.cross(r0r1, r0t1), r0t2)))<1e-4),True,False)
            ,mask=loTrue)

请注意，当不使用这种方法时，相同的过程是这样完成的：

    s3= np.sign(dot(np.cross(r0r1, r0t0), r0t1)  /6.0)
    s4= np.sign(dot(np.cross(r0r1, r0t1), r0t2)  /6.0)
    s5= np.sign(dot(np.cross(r0r1, r0t2), r0t0)  /6.0)
    loTrue= np.where((s1!=s2) & (abs(s3-s4)<1e-4) & ( abs(s5-s4)<1e-4) ,True,False)

两者都给出相同的结果，但是，仅在此过程中循环进行10k迭代时，不使用掩码数组会更快！（不带掩码数组的时间为26秒，带掩码数组的时间为31秒，仅在一行中使用带掩码的数组时为33秒（不分别计算s3，s4和s5，或之前不计算s4）。

结论：这里解决了使用嵌套数组的问题（请注意，掩码指示了将不计算掩码的位置，因此，在验证条件时，必须将第一个loTri设置为False（0））。但是，在这种情况下，速度并不快。

Answer 2

我可以从短路中获得小幅加速，但是我不认为值得额外的管理员。

full computation 4.463818839867599 ms per iteration (one ray, 20,000 triangles)
short ciruciting 3.0060838296776637 ms per iteration (one ray, 20,000 triangles)

代码：

import numpy as np

def ilt_cut(q1,q2,p1,p2,p3):
    qm = (q1+q2)/2
    qd = qm-q2
    p12 = p1-p2
    aux = np.cross(qd,q2-p2)
    s3 = np.einsum("ij,ij->i",aux,p12)
    s4 = np.einsum("ij,ij->i",aux,p2-p3)
    ge = (s3>=0)&(s4>=0)
    le = (s3<=0)&(s4<=0)
    keep = np.flatnonzero(ge|le)
    aux = p1[keep]
    qpm1 = qm-aux
    p31 = p3[keep]-aux
    s5 = np.einsum("ij,ij->i",np.cross(qpm1,p31),qd)
    ge = ge[keep]&(s5>=0)
    le = le[keep]&(s5<=0)
    flt = np.flatnonzero(ge|le)
    keep = keep[flt]
    n = np.cross(p31[flt], p12[keep])
    s12 = np.einsum("ij,ij->i",n,qpm1[flt])
    flt = np.abs(s12) <= np.abs(s3[keep]+s4[keep]+s5[flt])
    return keep[flt],qm-(s12[flt]/np.einsum("ij,ij->i",qd,n[flt]))[:,None]*qd

def ilt_full(q1,q2,p1,p2,p3):
    qm = (q1+q2)/2
    qd = qm-q2
    p12 = p1-p2
    qpm1 = qm-p1
    p31 = p3-p1
    aux = np.cross(qd,q2-p2)
    s3 = np.einsum("ij,ij->i",aux,p12)
    s4 = np.einsum("ij,ij->i",aux,p2-p3)
    s5 = np.einsum("ij,ij->i",np.cross(qpm1,p31),qd)
    n = np.cross(p31, p12)
    s12 = np.einsum("ij,ij->i",n,qpm1)
    ge = (s3>=0)&(s4>=0)&(s5>=0)
    le = (s3<=0)&(s4<=0)&(s5<=0)
    keep = np.flatnonzero((np.abs(s12) <= np.abs(s3+s4+s5)) & (ge|le))
    return keep,qm-(s12[keep]/np.einsum("ij,ij->i",qd,n[keep]))[:,None]*qd

tri = np.random.uniform(1, 10, (20_000, 3, 3))
p0, p1 = np.random.uniform(1, 10, (2, 3))

from timeit import timeit
A,B,C = tri.transpose(1,0,2)
print('full computation', timeit(lambda: ilt_full(p0[None], p1[None], A, B, C), number=100)*10, 'ms per iteration (one ray, 20,000 triangles)')
print('short ciruciting', timeit(lambda: ilt_cut(p0[None], p1[None], A, B, C), number=100)*10, 'ms per iteration (one ray, 20,000 triangles)')

请注意，我在算法上有些过分，所以可能不会在每种情况下都得到与您相同的结果。

我更改了：

我内联了tetra的体积，这样可以节省一些重复的子计算
我用射线的中点M替换了一个射线末端。这样可以节省计算一个四边形体积（s1或s2的时间，因为可以通过比较四边形ABCM的体积和{{1}的总和来检查射线是否穿过三角形ABC平面}，s3，s4（如果它们具有相同的符号）。

如何在另一个np.where中使用np.where（续：光线跟踪）

2 个答案: