是否有工具捕获浏览器端javascript生成的所有DOM网页元素为html,用于整页html存档?

时间:2011-04-25 19:29:17

标签: javascript dom web-scraping dynamic-html

如果通过javascript在我的浏览器中生成了一大堆元素(使用JSON数据或者只是凭空而来)我无法通过保存源来完全存档这样的页面。我已经尝试将其保存为IE中的.mht文件,但这不起作用 - IE也不保存动态生成的元素。

此类页面的一个示例是http://www.amazon.com/gp/bestsellers/wireless/ref=zg_bs_nav - 请注意源html中不存在“price”和“X new”元素,而是动态生成。

如果我想解析这个,我可以通过各种方式直接使用DOM,yadda-yadda。但是,如果我想自动将页面保存为html文档,以便即使在javascript关闭时也可以使用所有动态生成的元素进行渲染,到目前为止,我是SOL。

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

在Firefox中有Web Developer扩展:https://addons.mozilla.org/en-US/firefox/addon/web-developer/

安装完成后,您可以使用查看来源 - >查看生成源以访问JavaScript修改后的HTML。