我应该如何编写PHP脚本来复制网页?

时间:2011-07-10 18:23:25

标签: php web-scraping

我想写一个PHP脚本,给定一个URL,复制整个网页,包括图像,脚本,样式表等。

最好的解决方法是,有一个教程可以指导我完成吗?

我有一些PHP经验,但它主要基于表单,CMS,cookie和数据库。我该如何开始这项任务?

1 个答案:

答案 0 :(得分:3)

您可以通过以下方式获取任何页面的内容:

$url = "http://www.thisistheurl.com/";
$retries = 5;

while($retries > 0)
{
$contents = @file_get_contents($url);
if (strpos($http_response_headers[0],"200")
{
$retries = 0;
}
else {
$retries--;
}
}

然后您将整个页面放在变量内容中,您可以按原样显示它,也可以使用DOMDocument

解析它