我已经了解了有多种方法可以通过jQuery或使用跨域请求从其他网页获取源代码。我想尝试做的就是这样做,所以每次加载页面时我都会抓取一个具有不同代码的div,而不是整个源代码。例如,当您使用'检查元素时,您会看到更详细的信息。或者像firebug这样的工具可以深入了解页面代码。
我会使用相同的方法吗?
答案 0 :(得分:0)
是
如果您控制两个域,则可以添加Access_control_CORS
标题允许访问跨域请求并使用
无头浏览器像phantomJS一样抢到了缓存版本
呈现HTML
页。
如果您不控制这两个域,则必须编写服务器
获取页面及其所有资源的旁边代理(您将拥有
解析页面以获取或重写图像链接,javascripts,
样式表等...)然后通过phantomJS
运行它来创建一个
HTML
快照。
源:
https://developer.mozilla.org/en-US/docs/Web/Security/Same-origin_policy
https://developer.mozilla.org/en-US/docs/Web/HTTP/Access_control_CORS
http://phantomjs.org/
注意:尽管我付出了最大的努力,但堆栈溢出绝对确信这些链接是代码。很抱歉发布为代码。