有人对抓取拥有动态网页/查询的网站有任何想法吗?我的意思是,如果我单击某个链接,每次尝试在Web浏览器中重新加载它时都会有不同的值。现在我的webcrawler无法下载这些页面的内容。请指教。
答案 0 :(得分:1)
即使它是动态的也是如此。实际上爬虫只是3件事的主人
就是这样,
执行抓取工具时的常见问题:
希望有所帮助。
答案 1 :(得分:0)
您可能需要查看this问题详细说明如何编写抓取工具或查看包含良好抓取工具的http://searcharoo.net/的源代码(请参阅here)。