令人惊讶的是mutable.array.drop

时间:2016-11-28 05:03:08

标签: scala profiling yourkit

我是Scala的新手,当我尝试使用Scala对我的YourKit代码进行分析时,我对array.drop的使用情况有一些惊人的发现。

这是我写的:

...
val items = s.split(" +")   // s is a string
...
val s1 = items.drop(2).mkString(" ")
...

在我的代码运行1分钟后,YourKit告诉我,函数调用items.drop(2)大约占总执行时间的11%。

Lexer.scala:33 scala.collection.mutable.ArrayOps$ofRef.drop(int) 1054 11%

这对我来说真的很奇怪,是否有任何内部存储器副本会降低处理速度?如果是这样,优化我的简单代码片段的最佳做法是什么?谢谢。

1 个答案:

答案 0 :(得分:2)

  

这对我来说真的很奇怪,是否有任何内部存储器副本   那会减慢处理速度吗?

ArrayOps.drop在内部调用IterableLike.slice,它会为每次调用分配一个生成新Array的构建器:

override def slice(from: Int, until: Int): Repr = {
  val lo    = math.max(from, 0)
  val hi    = math.min(math.max(until, 0), length)
  val elems = math.max(hi - lo, 0)
  val b     = newBuilder
  b.sizeHint(elems)

  var i = lo
  while (i < hi) {
    b += self(i)
    i += 1
  }
  b.result()
}

您将看到迭代+分配的成本。你没有说明这种情况发生了多少次以及集合的大小是多少,但如果它很大,这可能会非常耗时。

优化此方法的一种方法是生成List[String],而不是简单地迭代集合并删除它的head元素。请注意,这将发生Array[T]的额外遍历以创建列表,因此请务必对此进行基准测试以确定您实际获得了任何内容:

val items = s.split(" +").toList
val afterDrop = items.drop(2).mkString(" ")

另一种可能性是丰富Array[T]以包含您自己的mkString版本,该版本会手动填充StringBuilder

object RichOps {
  implicit class RichArray[T](val arr: Array[T]) extends AnyVal {
    def mkStringWithIndex(start: Int, end: Int, separator: String): String = {
      var idx = start
      val stringBuilder = new StringBuilder(end - start)

      while (idx < end) {
        stringBuilder.append(arr(idx))
        if (idx != end - 1) {
          stringBuilder.append(separator)
        }
        idx += 1
      }

      stringBuilder.toString()
    }
  }
}

现在我们有:

object Test {
  def main(args: Array[String]): Unit = {
    import RichOps._
    val items = "hello everyone and welcome".split(" ")
    println(items.mkStringWithIndex(2, items.length, " "))
  }

收率:

and welcome
相关问题