从字符串的某个部分删除标点符号

时间:2017-11-07 18:50:53

标签: r regex

我有载体

a1 = "Hello, Mr. R.A. Ivanov, nice to see you here " 
a2 = "Mr. R.A.Ivanov, did you attend the concert last night"
a3 = "I finally met you Mr.R.A.Ivanov"

我想删除部分"Mr. R.A. Ivanov"中的标点符号,并在字符串中只有"Mr R A Ivanov"。所以,我的输出将是:

a1 ="Hello, Mr R A Ivanov, nice to see you here"

另外,可以注意到,字母之间有时会有空格,有时则没有。而且我也不知道如何处理它。

1 个答案:

答案 0 :(得分:0)

您可以使用gsub

执行此操作
gsub("\\b(Mr|[A-Z])\\.", "\\1 ", a1)