我正在尝试将任何页面的源加载到文本框中,仅供客户端html编辑器使用。我需要能够获得网页的整个来源,而不仅仅是正文。这个yql查询只返回正文:
http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22
有没有办法获得整个资源,还是有其他免费的json-p-x网络服务可以吗?
答案 0 :(得分:1)
我没有看到使用YQL的明显方法,但这是一个似乎有用的Yahoo Pipe。它拒绝获取robots.txt禁止访问的网站,但它获取了其他网站的整个来源:
http://pipes.yahoo.com/pipes/pipe.info?_id=dCsGDO123hG6BNv70EypaA
默认设置为www.example.com,由于该页面上的robots.txt而被拒绝。但是,它接受URL作为参数。以下是此管道示例用法的链接,该管道获取pipes.yahoo.com的源代码并返回包含在JSON中的结果:
这有帮助吗?