我是Scala
的新手,当我尝试使用Scala
对我的YourKit
代码进行分析时,我对array.drop
的使用情况有一些惊人的发现。
这是我写的:
...
val items = s.split(" +") // s is a string
...
val s1 = items.drop(2).mkString(" ")
...
在我的代码运行1分钟后,YourKit告诉我,函数调用items.drop(2)
大约占总执行时间的11%。
Lexer.scala:33 scala.collection.mutable.ArrayOps$ofRef.drop(int) 1054 11%
这对我来说真的很奇怪,是否有任何内部存储器副本会降低处理速度?如果是这样,优化我的简单代码片段的最佳做法是什么?谢谢。
答案 0 :(得分:2)
这对我来说真的很奇怪,是否有任何内部存储器副本 那会减慢处理速度吗?
ArrayOps.drop
在内部调用IterableLike.slice
,它会为每次调用分配一个生成新Array
的构建器:
override def slice(from: Int, until: Int): Repr = {
val lo = math.max(from, 0)
val hi = math.min(math.max(until, 0), length)
val elems = math.max(hi - lo, 0)
val b = newBuilder
b.sizeHint(elems)
var i = lo
while (i < hi) {
b += self(i)
i += 1
}
b.result()
}
您将看到迭代+分配的成本。你没有说明这种情况发生了多少次以及集合的大小是多少,但如果它很大,这可能会非常耗时。
优化此方法的一种方法是生成List[String]
,而不是简单地迭代集合并删除它的head
元素。请注意,这将发生Array[T]
的额外遍历以创建列表,因此请务必对此进行基准测试以确定您实际获得了任何内容:
val items = s.split(" +").toList
val afterDrop = items.drop(2).mkString(" ")
另一种可能性是丰富Array[T]
以包含您自己的mkString
版本,该版本会手动填充StringBuilder
:
object RichOps {
implicit class RichArray[T](val arr: Array[T]) extends AnyVal {
def mkStringWithIndex(start: Int, end: Int, separator: String): String = {
var idx = start
val stringBuilder = new StringBuilder(end - start)
while (idx < end) {
stringBuilder.append(arr(idx))
if (idx != end - 1) {
stringBuilder.append(separator)
}
idx += 1
}
stringBuilder.toString()
}
}
}
现在我们有:
object Test {
def main(args: Array[String]): Unit = {
import RichOps._
val items = "hello everyone and welcome".split(" ")
println(items.mkStringWithIndex(2, items.length, " "))
}
收率:
and welcome