寻找灵活的解决方案来减少序列</ p>
'abab' to 'ab' or
'abcdcded' to 'abcded'
但是,例如
'abcdefcd'
应保持不变。
然而,简化
'abcabcde' to 'abcde'
也会很好。
帮助表示感谢,谢谢。
答案 0 :(得分:3)
正则表达式可以引用同一正则表达式中的捕获组,以便在以下示例中"\\2"
引用第二个捕获组。
x <- c('abab', 'abcdcded', 'abcdefcd', 'abcabcde') # test data
sub("(.*)(.+)\\2(.*)", "\\1\\2\\3", x)
## [1] "ab" "abcded" "abcdefcd" "abcde"