我想以编程方式阅读网页(使用javascript-angular)并搜索内部的一些元素。我到现在所拥有的是:
$http.get('http://.....').success(function(data) {
var doc = new DOMParser().parseFromString(data, 'text/html');
var result = doc.evaluate('//div[@class = \'xx\']/a', doc, null, XPathResult.STRING_TYPE, null);
$scope.all = result.stringValue;
});
所以在示例中我可以读取任何html元素的值。
非常不幸,我想阅读的页面使用了一些Javascript,而源代码(html)只是其整个html源代码的一部分(包括DOM更改),最后的浏览器也是如此显示。所以从http get返回的html不一定包含我需要的元素。
有没有办法在javascript运行后获取整个html?
修改:是的,该网页来自其他网域+所提供的API不会向我提供我需要的信息。