如何使用Javascript执行客户端网络抓取?

时间:2016-04-17 22:29:35

标签: javascript web-scraping yql

如何在不违反same-origin policy的情况下完成此操作?我尝试过使用像http://anyorigin.com/这样的网站但没有成功,但它不起作用。我该如何实现这一目标?

1 个答案:

答案 0 :(得分:0)

事实证明,雅虎的YQL(雅虎查询语言)可以使用XPath在线查找网页HTML的元素。

只需在文档中包含以下内容:

<div id="a"></div>
<script>
    var yqlCallback = function(data){
    	var rep = data.query.results.div;
        document.getElementById('a').innerHTML = "StardustGogeta's reputation is "+rep+'.';
    };
</script>
<script type='application/javascript' src="https://query.yahooapis.com/v1/public/yql?q=select%20content%20from%20html%20where%20url%3D'http%3A%2F%2Fstackoverflow.com%2Fusers%2F5732397%2Fstardustgogeta'%20and%20xpath%3D'%2F%2Fdiv%5B%40class%3D%22reputation%22%5D'&format=json&env=store%3A%2F%2Fdatatables.org%2Falltableswithkeys&callback=yqlCallback"></script>