从R中的字符串中间提取连续的单词

时间:2017-09-27 20:15:37

标签: r regex string

好的,所以我是regexpr的新手,我的大脑即将煎炸。我想要做的是从字符串中提取第二个和第三个字。例如:

sentence <- "Certified 2017 Mazda CX-5 AWD Touring"
TheFunction(sentence)

应该返回“2017 Mazda”

我最初的尝试是使用类似的东西:

sub("\\s\\S+\\s\\S+\\s", "\\1", sentence)

但是失败了。我的想法是找到匹配“space-word-space-word-space”的第一个模式

1 个答案:

答案 0 :(得分:0)

您可以使用strsplit然后粘贴第二个和第三个单词

paste(strsplit(sentence, split = '\\s')[[1]][2:3], collapse = " ")