“展开”递归函数?

时间:2011-06-10 00:14:38

标签: python recursion cuda opencl

我正在用C ++编写路径跟踪器,我想尝试将最耗费资源的代码实现到CUDA或OpenCL中(我不确定选择哪一个)。

我听说我的显卡的CUDA版本不支持递归,这是我的路径追踪者大量使用的。

正如我在Python和C ++中编写的那样,我将发布一些简化的Python代码以便于阅读:

def Trace(ray):
  hit = what_object_is_hit(ray)

  if not hit:
    return Color(0, 0, 0)

  newRay = hit.bouceChildRayOffSurface(ray)

  return hit.diffuse * (Trace(newRay) + hit.emittance)

我尝试手动展开该功能,一个明确的模式(ddiffuseeemittance):< / p>

Level 1:  d1 * e1 

Level 2:  d1 * d2 * e2
        + e1

Level 3:  d1 * d2 * d3 * e3
        + d1 * d2 * e2
        + e1

Level 4:  d1 * d2 * d3 * d4 * e4
        + d1 * d2 * d3 * e3
        + d1 * d2 * e2
        + e1

我可能错了,但是......

我的问题是,如何在while循环中实现此代码?

我在考虑使用这种格式的东西:

total = Color(0, 0, 0)
n = 1

while n < 10:   # Maximum recursion depth
  result = magical_function()

  if not result:  break

  total += result
  n += 1

我以前从未真正处理过拆解递归函数的任务,所以任何帮助都会非常感激。谢谢!

3 个答案:

答案 0 :(得分:15)

在递归函数中,每次发生递归调用时,调用者的状态都会保存到堆栈中,然后在递归调用完成时恢复。要将递归函数转换为迭代函数,需要将挂起函数的状态转换为显式数据结构。当然,您可以在软件中创建自己的堆栈,但通常可以使用一些技巧来提高代码的效率。

此答案适用于此示例的转换步骤。您可以将相同的方法应用于其他循环。

尾递归转换

让我们再看看你的代码:

def Trace(ray):
  # Here was code to look for intersections

  if not hit:
      return Color(0, 0, 0)

  return hit.diffuse * (Trace(ray) + hit.emittance)

通常,递归调用必须返回到调用函数,因此调用者可以完成它正在做的事情。在这种情况下,呼叫者通过执行加法和乘法来“完成”。这产生了类似的计算 d1 * (d2 * (d3 * (... + e3) + e2) + e1))。我们可以利用加法的分布定律和乘法和加法的关联定律将计算转换为[d1 * e1] + [(d1 * d2) * e2] + [(d1 * d2) * d3) * e3] + ... 。请注意,本系列中的第一项仅涉及迭代1,第二项仅涉及迭代1和2,依此类推。这告诉我们,我们可以动态计算这个系列。此外,这个系列包含(d1, d1*d2, d1*d2*d3, ...)系列,我们也可以动态计算。把它放回代码中:

def Trace(diffuse, emittance, ray):
  # Here was code to look for intersections

  if not hit: return emittance                            # The complete value has been computed

  new_diffuse = diffuse * hit.diffuse                     # (...) * dN
  new_emittance = emittance + new_diffuse * hit.emittance # (...) + [(d1 * ... * dN) + eN]
  return Trace(new_diffuse, new_emittance, ray)

尾部递归消除

在新循环中,调用者在被调用者完成后无需做任何工作;它只是返回被调用者的结果。调用者没有工作要完成,因此不必保存任何状态!我们可以覆盖旧的参数而不是调用,而是回到函数的开头(不是有效的Python,但它说明了这一点):

def Trace(diffuse, emittance, ray):
  beginning:
  # Here was code to look for intersections

  if not hit: return emittance                            # The complete value has been computed

  new_diffuse = diffuse * hit.diffuse                     # (...) * dN
  new_emittance = emittance + new_diffuse * hit.emittance # (...) + [(d1 * ... * dN) + eN]
  (diffuse, emittance) = (new_diffuse, new_emittance)
  goto beginning

最后,我们将递归函数转换为等效循环。剩下的就是用Python语法表达它。

def Trace(diffuse, emittance, ray):
  while True:
    # Here was code to look for intersections

    if not hit: break

    diffuse = diffuse * hit.diffuse                 # (...) * dN
    emittance = emittance + diffuse * hit.emittance # (...) + [(d1 * ... * dN) + eN]

  return emittance

答案 1 :(得分:3)

你很幸运。你的代码使用尾递归,这是你使用递归作为函数中的最后一件事。编译器通常可以为你做,但你必须在这里手动完成:

total = Color(0, 0, 0)
mult = 1
n = 1

while n < 10:   # Maximum recursion depth
  # Here was code to look for intersections

  if not hit: break

  total += mult * hit.diffuse * hit.emittance
  mult *= hit.diffuse
  n += 1

return total

答案 2 :(得分:0)

通常,您始终可以使用堆栈来表示递归。

例如:

stack.push(Color(0,0,0), ray, 0) // color, ray, level#
while (!stack.empty()):
   current = stack.pop()
   if (current.level == 10): break
   // compute hit, and newray from current.ray
   stack.push(hit.diffuse*(current.color + hit.emittance), newray, current.level+1)
return current

本质上,递归通过将函数的参数推送到堆栈并使用新参数再次调用函数来工作。你只需要使用堆栈来模拟它。