正则表达式需要很长时间才能运行小数据集

时间:2017-08-10 08:00:42

标签: r regex-greedy

我试图做这个正则表达式:

([A-Za-z]+\\s*?)+\\-+\\s+\\$[0-9.]+")

搜索类似的模式:

Text Text2- $566.767 Text3 Text4- $7886.765 ...continues

以下是我使用的代码:

data_out <- data[,unlist(lapply(col,function(x) {str_extract_all(x,"([A-Za-z]+\\s*?)+\\-+\\s+\\$[0-9.]+")})),id]

上面的代码工作正常,但执行时间很长。

有没有更快的方法来提取上述模式?

下面屏幕截图中显示的预期输入和输出:

Sample Input and expected output screenshot

0 个答案:

没有答案