匹配链接中的href和'a'值

时间:2013-01-16 21:10:14

标签: regex html-parsing

如何匹配链接中的href和'a'值?

所以提取'www.google.com'&从下面'测试':

<A HREF="www.google.com/test.html" title="test">test</A>

以下是我正在尝试的内容:'<A HREF=(.+).html'但它不匹配?

3 个答案:

答案 0 :(得分:1)

试试这个:

<A.*HREF\s*=\s*(?:"|')([^"']*)(?:"|').*>(.*)<\/A>

Group1和Group2将为您提供所需的结果。

答案 1 :(得分:1)

HTML的正则表达式可能很难改变,但这个确切情况的正则表达式将是;

<A HREF="\(.*\)" .*>\(.*\)</A>

答案 2 :(得分:0)

因为文字html没有出现在您的代码中.....