您好,
我下载了大量用于数据挖掘的文件。我曾经使用PHP来达到这个目的,但我发现它太慢了。另外,我只想要一小部分网页。我想实现两件事
我不局限于PHP。如果curl在终端中效果更好,我会使用它。
答案 0 :(得分:2)
是的,您可以使用CURLOPT_RANGE选项仅下载页面的一部分,并且还可以提供一个写回调函数,当您收到“足够的”数据并且想要停止并移动时,该函数只会返回错误上。
答案 1 :(得分:0)
你在下载HTML吗?你的评论让我相信你是。如果是这种情况,只需使用Simple PHP DOM加载html并只获取所需的部分。虽然,我发现很难相信只抓取HTML会让你失望。您是否也下载了任何文件或媒体?
答案 2 :(得分:0)
无法仅下载部分页面。当您请求URL时,服务器响应就是它。
使用cURL制作multiple connections at once的能力,充分利用您的带宽。