Web scraper或harvester是从网站获取数据的软件, 如果有人能提出市场上可用的各种软件包,我将非常感激 他们必须能够动态收集(如AJAX)构建的网站。
答案 0 :(得分:1)
网络吸盘通常会关注页面上的硬链接(href
s)以获取下一页。
使用ajax,这是完全不同的。内容仅在需要时发送给客户端。因为我不知道任何网络刮板有一个非常有效的方法来指定参数我会做我自己的工具。这基本上包括伪造我自己的请求者并在服务器的webservice上使用它(插件)。
您可以使用不同的语言执行此操作,只要该语言支持http get / post请求。
调查伪造请求的方式:
$.post("servicePath.php", {"your": "forgedRequest"},function(data){alert(data)})