Google Chrome库/ api用于解释页面和返回页面信息

时间:2015-07-07 12:11:36

标签: javascript html google-chrome web-scraping

我基本上需要一种以编程方式获取Google Chrome的“Inspect element”功能的方法。我知道chrome为不同的语言(如JS和Java)提供了库和api。我希望了解的是,是否有一个带嵌入式浏览器功能的库/ api可能会返回“Inspect element”,其中包含css,js和html。

我最终希望得到的是:

var chromeconnection = chrome.connect ("www.myurl.com");
var pageInfo = chromeconnection.getPageInfo();

2 个答案:

答案 0 :(得分:0)

Chrome提供了用于浏览器开发工具的chrome.devtools.inspectedWindow

网站描述:

  

使用chrome.devtools.inspectedWindow API与。进行交互   检查窗口:获取被检查页面的选项卡ID,进行评估   检查窗口的上下文中的代码,重新加载页面,或   获取页面内的资源列表。

听起来和你需要的完全一样。

答案 1 :(得分:0)

我觉得Jaunt就是你要找的东西

  

HTML,XHTML,XML解析。协议:HTTP,HTTPS,
  基本认证。形成
  通过字段标签/名称/序列填写。
  自动形式排列。
  文件下载/上传。
  **保存完整的网页(图像,js,css等)   ** DOM导航,搜索&搜索链。启用正则表达式的查询。 HTTP
头/ cookie   操纵。 HTTP / HTTPS代理支持。
  可定制的缓存和内容
  处理程序。分页发现。
  100%Java(无依赖性)

http://jaunt-api.com/

你也有硒,它有一个非常大的社区,但我认为你想要做的事情太多了