我有这个正则表达式:
(?=<a .*href=")(.+)(?=".*>My Text<\/a>)
以此,我尝试从href
的特定HTML标记<a>
中提取HTML
的值。
假设我有这个HTML
:
<html>
<head>
...
</head>
<body>
...
<a class="..." href="..." ..="..">My Text</a>
...
</body>
</html>
使用正则表达式,我得到<a class="..." href="..." ..="..
(在">
之前停下来),但我只需要href
值。
编辑:此答案:regular expression for finding 'href' value of a <a> link对我没有帮助。通过该正则表达式,我得到了具有标签所有属性的所有标签<a>
。
答案 0 :(得分:2)
答案 1 :(得分:1)
您可以使用此正则表达式在href属性内找到链接:
正则表达式:
<a .*? `href="(.*?)"`.*?>(?>.*?<\/a>)
说明:
.*? ==> anything with non-greedy markup
href="(.*?)" ==> the captured group
(?>.*?<\/a>) ==> loop-ahead for the closed tag
演示: Here