Question

可能重复：
  RegEx match open tags except XHTML self-contained tags
  Grabbing the href attribute of an A element

我正在尝试从以下字符串中抓取一个网址...

<a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a>

这是我现在拥有的正则表达式......

<a class="uf" href="(.*?)">.*?<\/a>

然而，在抓取页面时没有得到任何结果。

我在这里做错了什么？

顺便说一下，我在PHP中这样做。

Answer 1

实际上你的正则表达式工作正常。您应该提供有关您尝试完成的内容的更多信息

试试这个：

$content = 'something <a class="uf" href="--"><b>Massage</b> Sacramento. Mae\'s Acupressure</a> some other text';
preg_match('#<a class="uf" href="(.*?)">.*?</a>#', $content, $matches);
print_r($matches);
exit;

它将打印：

Array
(
  [0] => <a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a>
  [1] => --
)

这是我能看到的预期结果

Answer 2

<a class="uf" href="[A-Za-z_-\.]*?">[A-Za-z_-\.]*?<\/a>

也不能忘记： RegEx match open tags except XHTML self-contained tags

创建一个用于抓取URL的简单正则表达式

2 个答案: