如我们在inspect元素中看到的,如何从网站中提取源代码

时间:2015-07-12 11:11:40

标签: web-scraping jsoup htmlunit

我想在chrome inspect element上获取网站的完整html源代码。

我正在尝试从http://bossip.com/1190557/cops-kill-people-mississippi-cop-under-investigation-for-strangling-unarmed-black-man-jonathan-sanders-to-death-43081/

中删除disqus的评论

最初我尝试使用java和Jsoup,但我无法提取完整的html源代码。

然后按照How to get html that I see in inspect element?中的建议,我尝试使用HTML单元但遗憾的是HTML单元也没有像我预期的那样提取。

这个问题有解决办法吗?

1 个答案:

答案 0 :(得分:-1)

在Chrome中,

  1. 在普通浏览器文档中:右键单击元素,选择" Inspect Element"从弹出菜单。您将转到"开发人员工具"窗口。
  2. 在开发人员工具窗口中:右键单击HTML元素,然后选择"编辑为HTML"从弹出菜单中。
  3. 在编辑器中选择所有HTML文本(按CTRL-A)并复制到剪贴板(按CTRL-C)