有人说Scala For comprehension实际上很慢。我被给出的原因是由于Java限制,因为理解(例如“reduce”,下面使用)需要在每次迭代时生成一个临时对象,以便调用传入的函数。
IS ...这... TRUE?下面的测试似乎证实了这一点,但我不完全理解为什么会这样。
这可能对“lambdas”或匿名函数有意义,但对非匿名函数则无效。
在我的测试中,我针对list.reduce运行了循环(参见下面的代码),发现它们的速度超过了两倍,即使每次迭代都调用了传递给reduce的完全相同的函数!
我发现这非常反直觉(曾经认为Scala库会被仔细创建为尽可能最佳)。
在我放在一起的测试中,我运行了相同的循环(总结数字1到100万,无论溢出)五种不同的方式:
结果如下: 测试:最小/最大/平均(毫秒)
1. 27/157/64.78
2. 27/192/65.77 <--- note the similarity between tests 1,2 and 4,5
3. 139/313/202.58
4. 63/342/150.18
5. 63/341/149.99
可以看出,“for comprehension”版本的顺序为“for for new for each instance”,暗示实际上可以为匿名和非匿名函数版本执行“new”。
方法:将下面的代码(删除测试调用)编译成单个.jar文件,以确保所有版本都运行相同的库代码。每次迭代中的每个测试都在一个新的JVM中调用(即scala -cp ...用于每个测试),以便消除堆大小问题。
class t(val i: Int) {
def summit(j: Int) = j + i
}
object bar {
val biglist:List[Int] = (1 to 1000000).toList
def summit(i: Int, j:Int) = i+j
// Simple for loop
def forloop: Int = {
var result: Int = 0
for(i <- biglist) {
result += i
}
result
}
// For loop with a function instead of inline math
def forloop2: Int = {
var result: Int = 0
for(i <- biglist) {
result = summit(result,i)
}
result
}
// for loop with a generated object PER iteration
def forloop3: Int = {
var result: Int = 0
for(i <- biglist) {
val t = new t(result)
result = t.summit(i)
}
result
}
// list.reduce with an anonymous function passed in
def anonymousfunc: Int = {
biglist.reduce((i,j) => {i+j})
}
// list.reduce with a named function
def realfunc: Int = {
biglist.reduce(summit)
}
// test calling code excised for brevity. One example given:
args(0) match {
case "1" => {
val start = System.currentTimeMillis()
forloop
val end = System.currentTimeMillis()
println("for="+(end - start))
}
...
}
答案 0 :(得分:15)
你被告知的是关于“理解”的真实情况,但问题的问题在于你将“理解”与“匿名函数”混为一谈。
Scala中的“for comprehension”是一系列.flatMap
,.map
和.filter
应用程序的语法糖。由于您正在测试简化算法,并且由于使用这三个函数无法实现简化算法,因此您的测试用例不正确。
以下是“for comprehension”的示例:
val listOfLists = List(List(1,2), List(3,4), List(5))
val result =
for {
itemOfListOfLists <- listOfLists
itemOfItemOfListOfLists <- itemOfListOfLists
}
yield (itemOfItemOfListOfLists + 1)
assert( result == List(2,3,4,5,6) )
编译器将理解部分去除以下内容:
val result =
listOfLists.flatMap(
itemOfListOfLists => itemOfListOfLists.map(
itemOfItemOfListOfLists => itemOfItemOfListOfLists + 1
)
)
然后它消除了匿名函数语法:
val result =
listOfLists.flatMap(
new Function1[List[Int], List[Int]] {
override def apply(itemOfListOfLists: List[Int]): List[Int] =
itemOfListOfLists.map(
new Function1[Int, Int] {
override def apply(itemOfItemOfListOfLists: Int): Int =
itemOfItemOfListOfLists + 1
}
)
}
)
从desugarred代码可以看出,Function1[Int, Int]
类每次调用apply(itemOfListOfLists: List[Int]): List[Int]
方法时都会被实例化。对listOfLists
的每个条目都会发生这种情况。因此,您理解的越复杂,您获得的Function
对象的实例化就越多。