创建一个用于抓取URL的简单正则表达式

时间:2011-08-04 16:59:06

标签: php regex

  

可能重复:
  RegEx match open tags except XHTML self-contained tags
  Grabbing the href attribute of an A element

我正在尝试从以下字符串中抓取一个网址...

<a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a>

这是我现在拥有的正则表达式......

<a class="uf" href="(.*?)">.*?<\/a>

然而,在抓取页面时没有得到任何结果。

我在这里做错了什么?

顺便说一下,我在PHP中这样做。

2 个答案:

答案 0 :(得分:1)

实际上你的正则表达式工作正常。您应该提供有关您尝试完成的内容的更多信息

试试这个:

$content = 'something <a class="uf" href="--"><b>Massage</b> Sacramento. Mae\'s Acupressure</a> some other text';
preg_match('#<a class="uf" href="(.*?)">.*?</a>#', $content, $matches);
print_r($matches);
exit; 

它将打印:

Array
(
  [0] => <a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a>
  [1] => --
)

这是我能看到的预期结果

答案 1 :(得分:0)

<a class="uf" href="[A-Za-z_-\.]*?">[A-Za-z_-\.]*?<\/a>

也不能忘记: RegEx match open tags except XHTML self-contained tags