从Chrome扩展程序输出生成的HTML

时间:2013-11-04 02:50:12

标签: javascript google-chrome dom google-chrome-extension scrape

在我的Chrome扩展程序中,我有一个内容脚本,可以运行并输出页面的初始源 HTML。 (As seen in VIEW SOURCE)只需使用document.documentElement.innerHTML

但我需要的是 Generated Source (Source/Current DOM after all JavaScript has finished executing [As seen in INSPECT ELEMENT]),我读过各种网站,以及与此相关的SO问题,但他们只根据外部请求进行了讨论来源,而不是铬扩展。我读过的一些选项是:

  • 通过服务器上托管的虚拟浏览器运行网址,以查看浏览器如何解释源并返回生成的源
  • 抓取页面初始源,并以某种方式侦听并记录所有JavaScript执行,然后在初始源上执行这些命令以尝试重新创建生成的源

由于Chrome扩展程序的内容脚本可能在打开标签页面中并行运行,因此有一些更简单/更有效的解决方案吗?我可以等待所有初始JavaScript完成执行然后获取当前DOM或源吗?

注意:执行任何额外的JavaScript命令后,我不需要跟踪DOM。在每个页面加载完成后执行的JavaScript之后,我只需要一个快照。

如果这听起来很幼稚,我提前道歉,我是制作Chrome扩展程序的新手。任何指向优秀资源,教程或示例的链接都将非常感激。

感谢您的时间。

0 个答案:

没有答案