Scala:fold vs foldLeft

时间:2013-04-19 18:40:39

标签: scala reduce fold

我试图了解fold和foldLeft以及各自的reduce和reduceLeft是如何工作的。我使用fold和foldLeft作为我的例子

scala> val r = List((ArrayBuffer(1, 2, 3, 4),10))
scala> r.foldLeft(ArrayBuffer(1,2,4,5))((x,y) => x -- y._1)

scala> res28: scala.collection.mutable.ArrayBuffer[Int] = ArrayBuffer(5)

scala> r.fold(ArrayBuffer(1,2,4,5))((x,y) => x -- y._1)
<console>:11: error: value _1 is not a member of Serializable with Equals
              r.fold(ArrayBuffer(1,2,4,5))((x,y) => x -- y._1)

为什么fold无效foldLeft?什么是Serializable with Equals?我理解fold和foldLeft在参数泛型类型方面有轻微不同的API签名。请指教。感谢。

1 个答案:

答案 0 :(得分:64)

方法fold(最初为并行计算添加)在可应用的类型方面不如foldLeft强大。它的签名是:

def fold[A1 >: A](z: A1)(op: (A1, A1) => A1): A1

这意味着完成折叠的类型必须是集合元素类型的超类型。

def foldLeft[B](z: B)(op: (B, A) => B): B

原因是fold可以并行实现,而foldLeft则不能。这不仅是因为*Left部分暗示foldLeft从左到右顺序排列,而且因为运算符op无法组合并行计算的结果 - 它只定义了将聚合类型B与元素类型A组合,但不是如何组合类型B的两个聚合。反过来,fold方法会对此进行定义,因为聚合类型A1必须是元素类型A的超类型,即A1 >: A。这种超类型关系允许同时折叠聚合和元素,并组合聚合 - 两者都与一个运算符。

但是,聚合和元素类型之间的这种超类型关系也意味着示例中的聚合类型A1应该是(ArrayBuffer[Int], Int)的超类型。由于聚合的零元素是类型ArrayBuffer(1, 2, 4, 5)的{​​{1}},因此聚合类型被推断为这两者的超类型 - 而且是ArrayBuffer[Int],唯一的最小上限一个元组和一个数组缓冲区。

通常,如果要允许任意类型的并行折叠(这不按顺序进行),则必须使用方法Serializable with Equals,这需要定义两个聚合的组合方式。在你的情况下:

aggregate

顺便说一下,尝试用r.aggregate(ArrayBuffer(1, 2, 4, 5))({ (x, y) => x -- y._1 }, (x, y) => x intersect y) / reduce编写你的例子 - 由于这两种方法都有元素类型和聚合类型之间的超类型关系,你会发现它导致了与您描述的错误类似的错误。