什么是以* clean *方式在Ruby中实现非常深度递归的正确方法?

时间:2017-03-19 11:31:46

标签: ruby recursion

当然,Ruby确实有递归,就像任何其他高级编程语言一样。只要递归深度不是太高,这就可以正常工作,但如果是,则会捕获堆栈溢出:

#!/usr/bin/ruby2.0
def rec_naive(i)
    return 1 if i==1
    rec_naive(i-1) + i
end

puts rec_naive(10000) #(Stack size: ~9360)
#==> test.rb:3: stack level too deep (SystemStackError)

最明显的解决方案是简单地增加堆栈大小。不幸的是,我在主题suggested上找到的答案以一种或另一种方式改变操作系统状态 - 修改Ruby解释器源代码,ulimit,编译标志等 - 这是纯粹的Ruby和当然,并非总是可行,特别是在安全的环境中。因此,想到的不太明显的解决方案是以非递归方式重写违规函数或重新实现调用堆栈:

# Recursion-free way
def rec_norecurse(i)
    acc = 0
    (1..i).each do |n|
        acc += n
    end
    return acc
end
puts rec_norecurse(100)

# Reimplementing the call stack
StackFrame = Struct.new(:state, :args)
def rec_customstack(stack)
    lastresult = nil
    until stack.empty?
        frame = stack.last
        state, args = frame.state, frame.args
        i = args[0]

        case state
            when :entrance_point
                if i==1
                    #-- return 1 #--
                    lastresult = 1
                    stack.pop
                    #---------------
                else
                    #-- rec(i-1) #--
                    stack.last.state = :returned_from_recursion
                    stack << StackFrame.new(:entrance_point, [i-1])
                    #---------------
                end
            when :returned_from_recursion
                #-- return rec_result+i #--
                lastresult = lastresult + i
                stack.pop
                #--------------------------
        end
    end
    return lastresult
end
customstack = [StackFrame.new(:entrance_point, [100])]
puts rec_customstack(customstack)

然而,以这种方式重写甚至不太复杂的函数可能是一项单调乏味的任务,并且结果代码似乎过于混乱并且与原始代码相比变得模糊不清。我想要涉及一些元编程并编写一些&#34;包装器&#34;,这可以使包装函数在深度递归时表现正常,同时保持足够干净,即使看起来不像未包装的那样。 我用Fibers实现了一个解决方案,最初似乎已经足够好了,但后来我遇到了一些意想不到的困难(详见see the related question)。

所以,我正在寻找一个正确的 clean - 尽可能减少混乱和模糊 - 实现非常深的递归调用的方式,而不会过多地损害性能。

2 个答案:

答案 0 :(得分:3)

我提出了这个解决方案。它仍然远非完美,但在没有更好的想法的情况下似乎已经足够好了。它基本上在递归调用时拆分函数,并推迟使用块后需要完成的任何计算:

def rcall(*args, &block)
    cs = [nil] #Call Stack
    rec = false
    rcaller = proc do |*pargs, &pblock|
        # Enqueue and return control to rcall
        rec = true # We *are* doing rcall
        cs << pblock
        pargs
    end
    result = args
    until cs.empty?
        rec = false

        result = block.call(rcaller, *result)
        while (!rec) && (!cs.empty?)
            # we got result! Return it to past preproc call and work it :3
            lastblock = cs.pop
            result = lastblock.call(*result) if !lastblock.nil?
        end
    end
    return result
end

用法:

puts (rcall 100 do |rcaller, i|
    if i==1
        1
    else
        rcaller.(i-1) {|i2|
            i2+i
        }
    end
end)
# ==> 5050

这比调用堆栈的重新实现更慢,但看起来更清晰。如果不需要post-rcall计算,它看起来会更好,类似于简单的尾调用 -

puts (rcall(100, []) do |rcaller, i, acc|
    if i==1
        [1, *acc]
    else
        rcaller.(i-1, [i, *acc])
    end
end).join', '
#==> 1, 2, 3..., 99, 100

答案 1 :(得分:1)

另一种选择是使用tail-call optimization来允许编译器生成迭代代码而不是在栈上推送方法和参数:

RubyVM::InstructionSequence.compile_option = {
  tailcall_optimization: true,
  trace_instruction: false
}

RubyVM::InstructionSequence.new(<<-EOF).eval
  def sum_down(n, acc=1)
    return acc if n == 1
    return sum_down(n-1, n+acc)
  end
EOF

puts sum_down(100)    # => 5050
puts sum_down(100000) # => 5000050000

这种方法可以抵抗堆栈溢出应该是一个快速的等效迭代方法。

对于优化尾递归函数的元编程解决方案,请参阅Tail Call Optimization in Ruby。解决这个问题的关键是使用method_source获取方法的来源。