Question

给出以下代码：

import scala.util.Random

object Reverser {

  // Fails for big list
  def reverseList[A](list : List[A]) : List[A] = {
    list match {
      case Nil => list
      case (x :: xs) => reverseList(xs) ::: List(x)
    }
  }

  // Works
  def reverseList2[A](list : List[A]) : List[A] = {
    def rlRec[A](result : List[A], list : List[A]) : List[A] = {
      list match {
        case Nil => result
        case (x :: xs) => { rlRec(x :: result, xs) }
      }
    }
    rlRec(Nil, list)
  }

  def main(args : Array[String]) : Unit = {
    val random = new Random
    val testList = (for (_ <- 1 to 2000000) yield (random.nextInt)).toList
    // val testListRev = reverseList(testList) <--- Fails
    val testListRev = reverseList2(testList)
    println(testList.head)
    println(testListRev.last)
  }
}

为什么第一个版本的函数失败（对于大输入），而第二个版本有效。我怀疑它与尾递归有关，但我不太确定。有人可以给我“傻瓜”的解释吗？

Answer 1

好吧让我试试假人的尾递归

如果您按照反向列表的方式进行操作，您将获得

reverseList(List(1,2,3, 4))
reverseList(List(2,3,4):::List(1)
(reverseList(List(3,4):::List(2)):::List(1)   
((reverseList(List(4):::List(3)):::List(2)):::List(1)
Nil:::List(4):::List(3):::List(2):::List(1)
List(4,3,2,1)

使用rlRec，你有

rlRec(List(1,2,3,4), Nil)
rlRec(List(2,3,4), List(1))
rlREc(List(3,4), List(2,1))
rlRec(List(4), List(3,2,1))
rlRec(Nil, List(4,3,2,1))
List(4,3,2,1)

不同之处在于，在第一种情况下，重写越来越长。在最后一次递归调用reverseList之后，你必须记住要做的事情：要添加到结果中的元素。堆栈用于记住这一点。当这太过分时，就会出现堆栈溢出。相反，使用rlRec，重写始终具有相同的大小。当最后一个rlRec完成时，结果可用。没有别的事可做，没有什么可记住的，不需要堆栈。关键是在rlRec中，递归调用为return rlRec(something else)，而reverseList为return f(reverseList(somethingElse))，f为_ ::: List(x)。您需要记住，您必须致电f（这意味着也要记住x）（scala中不需要返回，只是为了清晰起见而添加。另请注意，val a = recursiveCall(x); doSomethingElse()与{相同} {1}}，所以它不是尾调用）

当你有一个递归尾调用

doSomethingElseWith(recursiveCall(x))

实际上没有必要记住第二个将返回时第一个def f(x1,...., xn) ... return f(y1, ...yn) ...的上下文。所以它可以重写

这就是编译器所做的，因此可以避免堆栈溢出。

当然，函数def f(x1....xn) start: ... x1 = y1, .... xn = yn goto start ...需要返回一个不是递归调用的地方。这就是f创建的循环将退出的地方，就像递归调用序列停止的地方一样。

Answer 2

当函数将其自身称为最后一个操作时，函数被称为tail recursive。您可以通过添加tail recursive注释来检查该功能是否为@tailrec。

Answer 3

通过使用默认参数为结果提供初始值，您可以使尾递归版本与非尾递归版本一样简单：

def reverseList[A](list : List[A], result: List[A] = Nil) : List[A] = list match {
  case Nil => result
  case (x :: xs) => reverseList(xs, x :: result)
}

尽管您可以像其他人一样使用此方法，例如reverseList(List(1,2,3,4))，但遗憾的是，您使用可选的result参数公开了实现细节。目前似乎没有办法隐藏它。这可能会或可能不会让您担心。

Answer 4

正如其他人所提到的，尾部调用消除避免了在不需要时增加堆栈。如果您对优化的作用感到好奇，可以运行

scalac -Xprint:tailcalls MyFile.scala

...在消除阶段后显示编译器中间表示。（请注意，您可以在任何阶段之后执行此操作，并且可以使用scala -Xshow阶段打印阶段列表。）

例如，对于你的内部，尾递归函数rlRec，它给了我：

def rlRec[A >: Nothing <: Any](result: List[A], list: List[A]): List[A] = {
  <synthetic> val _$this: $line2.$read.$iw.$iw.type = $iw.this;
  _rlRec(_$this,result,list){
    list match {
      case immutable.this.Nil => result
      case (hd: A, tl: List[A])collection.immutable.::[A]((x @ _), (xs @ _)) => _rlRec($iw.this, {
        <synthetic> val x$1: A = x;
        result.::[A](x$1)
      }, xs)
    }
  }
}

没关注合成的东西，重要的是_rlRec是一个标签（即使它看起来像一个函数），并且在模式匹配的第二个分支中对_rlRec的“调用”将被编译为跳转在字节码中。

Answer 5

第一种方法不是尾递归。参见：

case (x :: xs) => reverseList(xs) ::: List(x)

调用的最后一个操作是:::，而不是递归调用reverseList。另一个是尾递归。

Answer 6

def reverse(n: List[Int]): List[Int] = {
  var a = n
  var b: List[Int] = List()
  while (a.length != 0) {
    b = a.head :: b
    a = a.tail
  }
  b
}

当您调用函数时，请调用它，

reverse(List(1,2,3,4,5,6))

那么它会给出这样的答案，

res0: List[Int] = List(6, 5, 4, 3, 2, 1)

反向列表Scala

6 个答案: