我需要自动执行任务以下拉一组网页并处理HTML。在有人建议使用wget或curl之前,我需要执行一些JS来更改DOM。
我想编写Chrome或Firefox脚本来获取HTML并渲染JS而不实际生成可视化界面。我无法弄清楚如何做到这一点。
有人有任何建议吗?
答案 0 :(得分:2)
使用Selenium RC。
Selenium Remote Control(RC)是一种允许您编写的测试工具 任何编程语言的自动化Web应用程序UI测试 任何使用任何主流支持JavaScript的浏览器的HTTP网站。