使用javascript导入外部页面

时间:2012-03-06 09:37:32

标签: javascript greasemonkey web-crawler

我想创建一个java脚本爬虫,它从php服务器获取一个赋值,然后索引页面。但我想要抓取的网站是外部的,我无法通过javascript与他们联系。有没有人有其他任务语言或javascript解决方案的解决方案。

我想在加载新网站时使用greasemonkey来抓取页面。

2 个答案:

答案 0 :(得分:1)

由于浏览器安全限制,您无法访问它们 - 我相信这称为跨站点脚本。这是PHP应用程序的作业类型,而不是客户端。

如果您需要客户端来完成工作,请从客户端请求相同的源策略绕过权限。见stackoverflow.com:can-i-disable-sop-same-origin-policy-on-any-browser-for-development

您可以使用Java applet实现相同的功能。

答案 1 :(得分:1)

jquery.xdomainajax.js能够加载外部页面。

以下是加载网页的简单代码

$(document).ready(function(){
   $('#test').load('http://abc.com', '', function(response, status, xhr) {
      if (status == 'error') {
          var msg = "Sorry but there was an error: ";
          $(".content").html(msg + xhr.status + " " + xhr.statusText);
      }
    });
}); 

它可以与跨域一起使用。