gsub错误提取URL与R,我错过了什么

时间:2016-01-21 05:48:12

标签: regex r gsub

我尝试提取网址,但每次运行代码时都是如此。它没用。错过了什么?任何帮助都会很棒。

  

x $ URL< - gsub(“(。*)(http://www.bloomin.com)(。 jpg)(。)”,
                “// 2 // 3”,x $ Product.Description。)

[1] // 2 // 3

这是我的回报。我想从下面的向量得到http://www.blooming.com/image/xxxxxxxx.jpg

void (*handler)(void)

1 个答案:

答案 0 :(得分:3)

  1. 反向引用必须以反斜杠引用,不能使用正斜杠。

  2. 使用.*?非贪婪)匹配.com与文件扩展名.jpg

    之间存在的所有字符
    x$URL <- gsub("(?s).*\\b(http://www\\.blooming\\.com\\b.*?\\.jpg\\b).*",
                                  "\\1", x$Product.Description.) 
    
  3. DEMO