我想创建一个java脚本爬虫,它从php服务器获取一个赋值,然后索引页面。但我想要抓取的网站是外部的,我无法通过javascript与他们联系。有没有人有其他任务语言或javascript解决方案的解决方案。
我想在加载新网站时使用greasemonkey来抓取页面。
答案 0 :(得分:1)
由于浏览器安全限制,您无法访问它们 - 我相信这称为跨站点脚本。这是PHP应用程序的作业类型,而不是客户端。
如果您需要客户端来完成工作,请从客户端请求相同的源策略绕过权限。见stackoverflow.com:can-i-disable-sop-same-origin-policy-on-any-browser-for-development
您可以使用Java applet实现相同的功能。
答案 1 :(得分:1)
jquery.xdomainajax.js能够加载外部页面。
以下是加载网页的简单代码
$(document).ready(function(){
$('#test').load('http://abc.com', '', function(response, status, xhr) {
if (status == 'error') {
var msg = "Sorry but there was an error: ";
$(".content").html(msg + xhr.status + " " + xhr.statusText);
}
});
});
它可以与跨域一起使用。