正则表达式匹配html属性

时间:2010-01-01 22:20:06

标签: php regex

我正在尝试匹配模式,以便我可以从网站检索字符串。这是问题中的字符串:

<a title="Posts by ivek dhwWaVa"
href="http://www.example.com/author/ivek/"
rel="nofollow">ivek</a>

我正在尝试在a标签之间匹配字符串“ivek”,我想为每个帖子执行此操作,与评论数量相关联。

首先,我应该使用上面的正则表达式是什么,所以我可以用它作为其余的例子。到目前为止我什么都没有:

$content = file_get_contents('http://www.example.com');
preg_match_all("", $content, $matches);

我如何将评论与作者姓名联系起来,因为网站上有许多其他作者以及他们自己的评论。我是否使用div来解决这个问题?由于每组信息都围绕着这个div:

<div id="post-54" class="excerpt">

感谢所有人的帮助!

2 个答案:

答案 0 :(得分:5)

请让我成为第一个向您介绍most famous answer on Stack Overflow

的人

正则表达式不适合解析HTML。你真的需要一个HTML解析器,即使对于看似简单的任务也是如此。

我推荐类似PHP Simple HTML DOM Parser的内容。

答案 1 :(得分:3)