我正在尝试匹配模式,以便我可以从网站检索字符串。这是问题中的字符串:
<a title="Posts by ivek dhwWaVa"
href="http://www.example.com/author/ivek/"
rel="nofollow">ivek</a>
我正在尝试在a标签之间匹配字符串“ivek”,我想为每个帖子执行此操作,将与评论数量相关联。
首先,我应该使用上面的正则表达式是什么,所以我可以用它作为其余的例子。到目前为止我什么都没有:
$content = file_get_contents('http://www.example.com');
preg_match_all("", $content, $matches);
我如何将评论与作者姓名联系起来,因为网站上有许多其他作者以及他们自己的评论。我是否使用div来解决这个问题?由于每组信息都围绕着这个div:
<div id="post-54" class="excerpt">
感谢所有人的帮助!
答案 0 :(得分:5)
请让我成为第一个向您介绍most famous answer on Stack Overflow。
的人正则表达式不适合解析HTML。你真的需要一个HTML解析器,即使对于看似简单的任务也是如此。
我推荐类似PHP Simple HTML DOM Parser的内容。
答案 1 :(得分:3)