最快捷最有效的方式来生成页面点击

时间:2016-06-23 10:41:36

标签: php web-crawler domcrawler

我正在尝试抓取我网站上的每个页面(由cron运行)来更新数据。大概有500页。

我尝试过两种选择。

  • PHP Simple HTML DOM Parser
  • PHP get_headers

使用上述任何一种方法,每页大约需要1.402秒才能加载。总共需要570秒。

有更有效的方法吗?

1 个答案:

答案 0 :(得分:0)

并行请求页面(即同时)。然后每个请求需要多长时间并不重要,因为许多请求会立即触发。

有很多方法可以实现这一目标,但这里有一个例子:

curl www.website.com/page1 &
curl www.website.com/page2 &
curl www.website.com/page3 &

使用xargs或其他工具来防止服务器充斥过多的并发连接。例如Bash script processing commands in parallel

在单个PHP脚本中并行运行命令可能很复杂。如果可能,更容易使用命令行。