逗人,
我已经尝试"\b \b"
和(.*)["]
来获取正则表达式,它允许我选择以“my.website”开头的url,并以源代码中的此URL结束“myfile”:
<a class="URL" href="http://my.website.com/a/b/cdefghijklmnopqrstuvwxyz/myfile" target="_blank">
请任何想法!
答案 0 :(得分:1)
使用此模式:
"(.*my.website.*myfile)"
然后$1
包含预期的网址。
"
匹配字符“字面上(
抓捕小组.*my.website
直到my.website
.*myfile
直到myfile
答案 1 :(得分:1)
这将是一个通用的解决方案
$ grep -oP "(?<=href=\"http://)[^\"]+" file
my.website.com/a/b/cdefghijklmnopqrstuvwxyz/myfile