Question

我正在尝试匹配模式，以便我可以从网站检索字符串。这是问题中的字符串：

<a title="Posts by ivek dhwWaVa"
href="http://www.example.com/author/ivek/"
rel="nofollow">ivek</a>

我正在尝试在a标签之间匹配字符串“ivek”，我想为每个帖子执行此操作，将与评论数量相关联。

首先，我应该使用上面的正则表达式是什么，所以我可以用它作为其余的例子。到目前为止我什么都没有：

$content = file_get_contents('http://www.example.com');
preg_match_all("", $content, $matches);

我如何将评论与作者姓名联系起来，因为网站上有许多其他作者以及他们自己的评论。我是否使用div来解决这个问题？由于每组信息都围绕着这个div：

<div id="post-54" class="excerpt">

感谢所有人的帮助！

Answer 1

请让我成为第一个向您介绍most famous answer on Stack Overflow。

的人

正则表达式不适合解析HTML。你真的需要一个HTML解析器，即使对于看似简单的任务也是如此。

我推荐类似PHP Simple HTML DOM Parser的内容。

Answer 2

你真的不应该让Regex去做这个工作：