我可以通过Javascript从其他网页获取特定页面HTML代码吗?

时间:2015-01-22 21:01:13

标签: javascript jquery html cross-domain

我已经了解了有多种方法可以通过jQuery或使用跨域请求从其他网页获取源代码。我想尝试做的就是这样做,所以每次加载页面时我都会抓取一个具有不同代码的div,而不是整个源代码。例如,当您使用'检查元素时,您会看到更详细的信息。或者像firebug这样的工具可以深入了解页面代码。

我会使用相同的方法吗?

1 个答案:

答案 0 :(得分:0)

如果您控制两个域,则可以添加Access_control_CORS 标题允许访问跨域请求并使用 无头浏览器像phantomJS一样抢到了缓存版本 呈现HTML页。

如果您不控制这两个域,则必须编写服务器 获取页面及其所有资源的旁边代理(您将拥有 解析页面以获取或重写图像链接,javascripts, 样式表等...)然后通过phantomJS运行它来创建一个 HTML快照。

源:

https://developer.mozilla.org/en-US/docs/Web/Security/Same-origin_policy
https://developer.mozilla.org/en-US/docs/Web/HTTP/Access_control_CORS
http://phantomjs.org/

注意:尽管我付出了最大的努力,但堆栈溢出绝对确信这些链接是代码。很抱歉发布为代码。