有没有办法用yql获取页面的整个源代码?

时间:2009-07-22 18:01:37

标签: javascript html web-services proxy yql

我正在尝试将任何页面的源加载到文本框中,仅供客户端html编辑器使用。我需要能够获得网页的整个来源,而不仅仅是正文。这个yql查询只返回正文:

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22

有没有办法获得整个资源,还是有其他免费的json-p-x网络服务可以吗?

1 个答案:

答案 0 :(得分:1)

我没有看到使用YQL的明显方法,但这是一个似乎有用的Yahoo Pipe。它拒绝获取robots.txt禁止访问的网站,但它获取了其他网站的整个来源:

http://pipes.yahoo.com/pipes/pipe.info?_id=dCsGDO123hG6BNv70EypaA

默认设置为www.example.com,由于该页面上的robots.txt而被拒绝。但是,它接受URL作为参数。以下是此管道示例用法的链接,该管道获取pipes.yahoo.com的源代码并返回包含在JSON中的结果:

http://pipes.yahoo.com/pipes/pipe.run?_id=dCsGDO123hG6BNv70EypaA&_render=json&url=http%3A%2F%2Fpipes.yahoo.com%2F

这有帮助吗?