反向列表Scala

时间:2011-09-08 09:07:48

标签: list scala recursion functional-programming tail-recursion

给出以下代码:

import scala.util.Random

object Reverser {

  // Fails for big list
  def reverseList[A](list : List[A]) : List[A] = {
    list match {
      case Nil => list
      case (x :: xs) => reverseList(xs) ::: List(x)
    }
  }

  // Works
  def reverseList2[A](list : List[A]) : List[A] = {
    def rlRec[A](result : List[A], list : List[A]) : List[A] = {
      list match {
        case Nil => result
        case (x :: xs) => { rlRec(x :: result, xs) }
      }
    }
    rlRec(Nil, list)
  }

  def main(args : Array[String]) : Unit = {
    val random = new Random
    val testList = (for (_ <- 1 to 2000000) yield (random.nextInt)).toList
    // val testListRev = reverseList(testList) <--- Fails
    val testListRev = reverseList2(testList)
    println(testList.head)
    println(testListRev.last)
  }
}

为什么第一个版本的函数失败(对于大输入),而第二个版本有效。我怀疑它与尾递归有关,但我不太确定。有人可以给我“傻瓜”的解释吗?

6 个答案:

答案 0 :(得分:30)

好吧让我试试假人的尾递归

如果您按照反向列表的方式进行操作,您将获得

reverseList(List(1,2,3, 4))
reverseList(List(2,3,4):::List(1)
(reverseList(List(3,4):::List(2)):::List(1)   
((reverseList(List(4):::List(3)):::List(2)):::List(1)
Nil:::List(4):::List(3):::List(2):::List(1)
List(4,3,2,1)

使用rlRec,你有

rlRec(List(1,2,3,4), Nil)
rlRec(List(2,3,4), List(1))
rlREc(List(3,4), List(2,1))
rlRec(List(4), List(3,2,1))
rlRec(Nil, List(4,3,2,1))
List(4,3,2,1)

不同之处在于,在第一种情况下,重写越来越长。在最后一次递归调用reverseList之后,你必须记住要做的事情:要添加到结果中的元素。堆栈用于记住这一点。当这太过分时,就会出现堆栈溢出。相反,使用rlRec,重写始终具有相同的大小。当最后一个rlRec完成时,结果可用。没有别的事可做,没有什么可记住的,不需要堆栈。关键是在rlRec中,递归调用为return rlRec(something else),而reverseListreturn f(reverseList(somethingElse))f_ ::: List(x)。您需要记住,您必须致电f(这意味着也要记住x)(scala中不需要返回,只是为了清晰起见而添加。另请注意,val a = recursiveCall(x); doSomethingElse()与{相同} {1}},所以它不是尾调用)

当你有一个递归尾调用

doSomethingElseWith(recursiveCall(x))

实际上没有必要记住第二个将返回时第一个def f(x1,...., xn) ... return f(y1, ...yn) ... 的上下文。所以它可以重写

f

这就是编译器所做的,因此可以避免堆栈溢出。

当然,函数def f(x1....xn) start: ... x1 = y1, .... xn = yn goto start ... 需要返回一个不是递归调用的地方。这就是f创建的循环将退出的地方,就像递归调用序列停止的地方一样。

答案 1 :(得分:18)

当函数将其自身称为最后一个操作时,函数被称为tail recursive。您可以通过添加tail recursive注释来检查该功能是否为@tailrec

答案 2 :(得分:10)

通过使用默认参数为结果提供初始值,您可以使尾递归版本与非尾递归版本一样简单:

def reverseList[A](list : List[A], result: List[A] = Nil) : List[A] = list match {
  case Nil => result
  case (x :: xs) => reverseList(xs, x :: result)
}

尽管您可以像其他人一样使用此方法,例如reverseList(List(1,2,3,4)),但遗憾的是,您使用可选的result参数公开了实现细节。目前似乎没有办法隐藏它。这可能会或可能不会让您担心。

答案 3 :(得分:9)

正如其他人所提到的,尾部调用消除避免了在不需要时增加堆栈。如果您对优化的作用感到好奇,可以运行

scalac -Xprint:tailcalls MyFile.scala

...在消除阶段后显示编译器中间表示。 (请注意,您可以在任何阶段之后执行此操作,并且可以使用scala -Xshow阶段打印阶段列表。)

例如,对于你的内部,尾递归函数rlRec,它给了我:

def rlRec[A >: Nothing <: Any](result: List[A], list: List[A]): List[A] = {
  <synthetic> val _$this: $line2.$read.$iw.$iw.type = $iw.this;
  _rlRec(_$this,result,list){
    list match {
      case immutable.this.Nil => result
      case (hd: A, tl: List[A])collection.immutable.::[A]((x @ _), (xs @ _)) => _rlRec($iw.this, {
        <synthetic> val x$1: A = x;
        result.::[A](x$1)
      }, xs)
    }
  }
}

没关注合成的东西,重要的是_rlRec是一个标签(即使它看起来像一个函数),并且在模式匹配的第二个分支中对_rlRec的“调用”将被编译为跳转在字节码中。

答案 4 :(得分:6)

第一种方法不是尾递归。参见:

case (x :: xs) => reverseList(xs) ::: List(x)

调用的最后一个操作是:::,而不是递归调用reverseList。另一个是尾递归。

答案 5 :(得分:1)

def reverse(n: List[Int]): List[Int] = {
  var a = n
  var b: List[Int] = List()
  while (a.length != 0) {
    b = a.head :: b
    a = a.tail
  }
  b
}

当您调用函数时,请调用它,

reverse(List(1,2,3,4,5,6))

那么它会给出这样的答案,

res0: List[Int] = List(6, 5, 4, 3, 2, 1)