在R

时间:2017-11-24 23:03:33

标签: r sequence

寻找灵活的解决方案来减少序列<​​/ p>

'abab' to 'ab' or 
'abcdcded' to 'abcded' 

但是,例如

'abcdefcd'

应保持不变。

然而,简化

'abcabcde' to 'abcde' 

也会很好。

帮助表示感谢,谢谢。

1 个答案:

答案 0 :(得分:3)

正则表达式可以引用同一正则表达式中的捕获组,以便在以下示例中"\\2"引用第二个捕获组。

x <- c('abab', 'abcdcded', 'abcdefcd', 'abcabcde') # test data

sub("(.*)(.+)\\2(.*)", "\\1\\2\\3", x)
## [1] "ab" "abcded" "abcdefcd" "abcde"