我看到Moller和Trumbore经常推荐Fast Minimum Storage Ray/Triangle Intersection。
问题是,我不介意预先计算和存储任何数量的数据,只要它加速交叉点。
所以我的问题是,不关心记忆,做射线三角交叉的最快方法是什么?
编辑:我不会移动三角形,即它是静态场景。
答案 0 :(得分:9)
正如其他人所提到的,加快速度的最有效方法是使用加速结构来减少所需的射线 - 三角形交叉点的数量。也就是说,你仍然希望你的光线三角形交叉点很快。如果您很乐意预先计算内容,可以尝试以下方法:
将光线和三角形边缘转换为Plücker coordinates。这允许您确定您的光线是否通过每边6乘以/加的三角形。您仍然需要将光线起点和终点与三角形平面进行比较(每点4乘以/加),以确保它实际上击中三角形。
最差情况运行时费用是26乘以/加总数。另外,请注意,您只需要为每个光线/边缘组合计算一次光线/边缘符号,因此,如果您正在评估网格,则可以使用两次边缘评估。
此外,这些数字假设一切都在齐次坐标中完成。您可以通过提前规范化来减少乘法次数。
答案 1 :(得分:5)
我已经完成了很多的基准测试,我可以自信地说,最快的(已发布)方法是Havel和Herout发明的方法,并在他们的论文中提出Yet Faster Ray-Triangle Intersection (Using SSE4)。即使不使用SSE ,它的速度也是Möller和Trumbore算法的两倍。
Havel-Herout的我的C实现:
typedef struct {
vec3 n0; float d0;
vec3 n1; float d1;
vec3 n2; float d2;
} isect_hh_data;
void
isect_hh_pre(vec3 v0, vec3 v1, vec3 v2, isect_hh_data *D) {
vec3 e1 = v3_sub(v1, v0);
vec3 e2 = v3_sub(v2, v0);
D->n0 = v3_cross(e1, e2);
D->d0 = v3_dot(D->n0, v0);
float inv_denom = 1 / v3_dot(D->n0, D->n0);
D->n1 = v3_scale(v3_cross(e2, D->n0), inv_denom);
D->d1 = -v3_dot(D->n1, v0);
D->n2 = v3_scale(v3_cross(D->n0, e1), inv_denom);
D->d2 = -v3_dot(D->n2, v0);
}
inline bool
isect_hh(vec3 o, vec3 d, float *t, vec2 *uv, isect_hh_data *D) {
float det = v3_dot(D->n0, d);
float dett = D->d0 - v3_dot(o, D->n0);
vec3 wr = v3_add(v3_scale(o, det), v3_scale(d, dett));
uv->x = v3_dot(wr, D->n1) + det * D->d1;
uv->y = v3_dot(wr, D->n2) + det * D->d2;
float tmpdet0 = det - uv->x - uv->y;
int pdet0 = ((int_or_float)tmpdet0).i;
int pdetu = ((int_or_float)uv->x).i;
int pdetv = ((int_or_float)uv->y).i;
pdet0 = pdet0 ^ pdetu;
pdet0 = pdet0 | (pdetu ^ pdetv);
if (pdet0 & 0x80000000)
return false;
float rdet = 1 / det;
uv->x *= rdet;
uv->y *= rdet;
*t = dett * rdet;
return *t >= ISECT_NEAR && *t <= ISECT_FAR;
}
答案 2 :(得分:2)
一个建议可能是实现八叉树(http://en.wikipedia.org/wiki/Octree)算法将3D空间划分为非常精细的块。分区越精细,所需的内存越多,但树的准确性越高。
您仍然需要检查光线/三角形交叉点,但想法是树可以告诉您何时可以跳过光线/三角形交叉点,因为光线可以保证不会碰到三角形。
但是,如果你开始移动你的三角形,你需要更新八叉树,然后我不确定它会为你节省一些东西。
答案 3 :(得分:2)
Dan Sunday发现这篇文章:
基于第一次拒绝测试之前完成的操作计数,该算法的效率低于MT(Möller&amp; Trumbore)算法,[...]。但是,MT算法使用两个交叉乘积,而我们的算法只使用一个,我们使用的算法计算三角形平面的法向量,这是计算线参数 rI 所需的。但是,当法线向量已经预先计算并存储在场景中的所有三角形时(通常就是这种情况),我们的算法根本不必计算这个交叉积。但是,在这种情况下,MT算法仍会计算两个交叉积,并且效率低于我们的算法。