将正则表达式与网址

时间:2016-04-18 20:30:50

标签: regex regular-language

逗人,

我已经尝试"\b \b"(.*)["]来获取正则表达式,它允许我选择以“my.website”开头的url,并以源代码中的此URL结束“myfile”:

<a class="URL" href="http://my.website.com/a/b/cdefghijklmnopqrstuvwxyz/myfile" target="_blank">

请任何想法!

2 个答案:

答案 0 :(得分:1)

使用此模式:

"(.*my.website.*myfile)"

Online Demo

然后$1包含预期的网址。

  • "匹配字符“字面上
  • (抓捕小组
  • .*my.website直到my.website
  • .*myfile直到myfile

答案 1 :(得分:1)

这将是一个通用的解决方案

$ grep -oP "(?<=href=\"http://)[^\"]+" file

my.website.com/a/b/cdefghijklmnopqrstuvwxyz/myfile