如何根据周围的字符提取关键字

时间:2016-01-27 05:05:59

标签: r text-mining

尝试从R中的字符串中提取关键字,但到目前为止无法找到解决方案

给出字符串

"erj\"abc\"ejwojeowje \"123\"fjoejfoejf" 

如何将关键字"abc""123"提取到字符向量中? 我尝试使用基于strsplit的{​​{1}},但它也会返回其他不必要的关键字。

1 个答案:

答案 0 :(得分:1)

我们可以尝试sub

scan(text=sub('[^"]+"([^"]+)"[^"]+"(\\d+).*',
                           "\\1 \\2", str1), what='')
#[1] "abc" "123"

数据

str1 <- "erj\"abc\"ejwojeowje \"123\"fjoejfoejf"