Scala提供了开箱即用的方法来处理模式的所有出现或全部出现。
仅替换第n次出现的最佳方法(或规范方法)是什么?
我可以想到几个解决方案,但我真的不喜欢其中任何一个。
第一个使用可变var来跟踪事件。
def f1(str: String, pattern: String, occurrence: Int) = {
pattern.r.replaceAllIn(str, {var c = 0
m: Match => {
c = c + 1
if (c == occurrence) m.group(1).reverse else m.group(1)
}
})
}
println(f1("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))
第二个查找所有匹配项,选择所需的字符串,然后为String应用补丁方法。
def f2(str: String, pattern: String, occurrence: Int) = {
val m = pattern.r.findAllMatchIn(str).toList.lift(occurrence-1)
m match {
case Some(m) => str.patch(m.start(1), m.group(1).reverse, m.group(1).length)
case None => str
}
}
println(f2("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))
是否有更简洁/更可取或更好的方法?
更新
使用zipAll的另一种方法。
def f5(str: String, pattern: String, occurrence: Int) = {
val m = pattern.r.findAllIn(str).toArray
val x = str.split(pattern)
if (x.size>occurrence) m(occurrence-1) = m(occurrence-1).reverse
x.zipAll(m, "", "").flatMap(t => List(t._1, t._2)).mkString
}
具有1 000 000次执行的功能f1 ... f5以及以下用于测量经过时间的功能的性能测试的结果
def time[R](block: => R): R = {
val t0 = System.nanoTime()
val result = block // call-by-name
val t1 = System.nanoTime()
println("Elapsed time: " + (t1 - t0) + "ns")
result
}
Elapsed time: 6352446800ns
Elapsed time: 4832129400ns
Elapsed time: 3153650800ns
Elapsed time: 3501623300ns
Elapsed time: 6276521500ns
f3似乎是最好的(预期)。
答案 0 :(得分:4)
我认为您的第二种方法是一种很好的方法,但是我不会为List
的操作而烦恼。
def f3(str: String, pattern: String, occurrence: Int) = {
val mi = pattern.r.findAllMatchIn(str).drop(occurrence - 1)
if (mi.hasNext) {
val m = mi.next()
val s = m.group(0)
str.patch(m.start, s.reverse, s.length)
} else str
}
更新:您也可以尝试进行此轻微修改。
def f4(str: String, pattern: String, occurrence: Int) =
util.Try{pattern.r.findAllMatchIn(str).drop(occurrence - 1).next()
}.fold(_=>str, m=>str.patch(m.start, m.group(0).reverse, m.group(0).length))
f4("aaa bbb123, ccc456, ddd789, qqq1010 206z", "\\d+", 3)
这更简洁(一行)并且更安全(如果pattern
无法编译为正则表达式则不会抛出),但我不确定它实际上是否更可取。