使用curl从网页获取特定div

时间:2014-01-07 23:33:16

标签: php html curl

我有一个来自rss Feed的页面,但它是使用其他htmlheadbody标记生成的。我想只从该页面获取一个div及其内容并将其加载到我的页面中。我想我需要使用curl从页面加载,我发现了许多加载整个页面的例子,但是我怎样才能加载我正在寻找的特定div?

1 个答案:

答案 0 :(得分:2)

首先,没有理由使用curl进行简单的页面下载,只需使用:

$html = file_get_contents('http://www.stackoverflow.com');

之后你有两个选择:

  1. 使用DOM Parser将HTML解析为DOM树,并使用它来检索特定元素。这仅适用于页面相对有效的HTML。
  2. 使用正则表达式或strpossubstr查找您关注的代码的特定部分。
  3. 纯粹主义者通常讨厌选项2,因为它在很多方面本质上都不如第一种。然而,编码和不良源代码的工作量也更少,可能更可靠。您想要使用哪个选项取决于您 - 对于一个简单的一次性案例,我肯定会采用简单的方法,如果您了解它们则使用正则表达式,如果不了解,则使用strpos