使用cURL或DOM进行Web抓取

时间:2013-05-06 12:49:50

标签: php dom html web-scraping

我已经在这个工作了大约四个小时,并且已经在互联网上尝试理解它,所以请保持温和。

我想在我的php页面上显示来自外部源的div。我尝试将file_get_domsimplexml_load_filefile_get_contentspreg_match_all一起使用,然后将其打印在我的页面上,但它们无效。 cURLing是我所见过的,无法理解任何一个,但我被告知这是最好的方法。当我想要的只是获取外部div的内容时,它们都会导致各种错误。我该怎么办?

示例是抓取此页面上的div id='hmenus',然后将其显示在我的本地页面上。

谢谢!

1 个答案:

答案 0 :(得分:1)

如果cURL超过您的头脑,那么可以尝试Simple HTML DOM

$html = file_get_html($url);
echo $html->find('div[id=hmenus]', 0);