将第n次出现替换为相反方向

时间:2019-05-15 15:14:58

标签: regex scala

Scala提供了开箱即用的方法来处理模式的所有出现或全部出现。

仅替换第n次出现的最佳方法(或规范方法)是什么?

我可以想到几个解决方案,但我真的不喜欢其中任何一个。

第一个使用可变var来跟踪事件。

  def f1(str: String, pattern: String, occurrence: Int) = {
    pattern.r.replaceAllIn(str, {var c = 0
      m: Match => {
      c = c + 1
      if (c == occurrence) m.group(1).reverse else m.group(1)
      }
    })
  }

  println(f1("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))

第二个查找所有匹配项,选择所需的字符串,然后为String应用补丁方法。

  def f2(str: String, pattern: String, occurrence: Int) = {
    val m = pattern.r.findAllMatchIn(str).toList.lift(occurrence-1)
    m match {
      case Some(m) => str.patch(m.start(1), m.group(1).reverse, m.group(1).length)
      case None => str
    }
  }

  println(f2("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))

是否有更简洁/更可取或更好的方法?

更新

使用zipAll的另一种方法。

  def f5(str: String, pattern: String, occurrence: Int) = {
    val m = pattern.r.findAllIn(str).toArray
    val x = str.split(pattern)
    if (x.size>occurrence) m(occurrence-1) = m(occurrence-1).reverse
    x.zipAll(m, "", "").flatMap(t => List(t._1, t._2)).mkString
  }

具有1 000 000次执行的功能f1 ... f5以及以下用于测量经过时间的功能的性能测试的结果

  def time[R](block: => R): R = {
    val t0 = System.nanoTime()
    val result = block    // call-by-name
    val t1 = System.nanoTime()
    println("Elapsed time: " + (t1 - t0) + "ns")
    result
  }

Elapsed time: 6352446800ns
Elapsed time: 4832129400ns
Elapsed time: 3153650800ns
Elapsed time: 3501623300ns
Elapsed time: 6276521500ns

f3似乎是最好的(预期)。

1 个答案:

答案 0 :(得分:4)

我认为您的第二种方法是一种很好的方法,但是我不会为List的操作而烦恼。

def f3(str: String, pattern: String, occurrence: Int) = {
  val mi = pattern.r.findAllMatchIn(str).drop(occurrence - 1)
  if (mi.hasNext) {
    val m = mi.next()
    val s = m.group(0)
    str.patch(m.start, s.reverse, s.length)
  } else str
}

更新:您也可以尝试进行此轻微修改。

def f4(str: String, pattern: String, occurrence: Int) =
  util.Try{pattern.r.findAllMatchIn(str).drop(occurrence - 1).next()
  }.fold(_=>str, m=>str.patch(m.start, m.group(0).reverse, m.group(0).length))


f4("aaa bbb123, ccc456, ddd789, qqq1010 206z", "\\d+", 3)

这更简洁(一行)并且更安全(如果pattern无法编译为正则表达式则不会抛出),但我不确定它实际上是否更可取。