仅提取节标题的句子部分

时间:2018-06-29 14:03:25

标签: r

我有一个小问题。

我的文字如下:

B.1 My name is John

我只想获得:

My name is John

我很难同时遗漏B和1

2 个答案:

答案 0 :(得分:2)

您可以使用sub和正则表达式来执行此操作。

TestStrings = c("B.1 My name is John", "A.12 This is another sentence")
sub("\\b[A-Z]\\.\\d+\\s+", "", TestStrings)
[1] "My name is John"          "This is another sentence"

\\ b表示单词边界(以消除多个字母)

[A-Z]将匹配一个大写字母。

\\。将匹配一个期间

\\ d +将匹配一个或多个数字

\\ s +将匹配任何训练空白。

匹配的部分将被替换为空字符串。

答案 1 :(得分:1)

如果您确定所需的所有字符串都具有相同(或相似)的初始部分,则可以

> a<-"B.1 My name is John"
> substr(a, 5, nchar(a))
[1] "My name is John"