我目前正在实施Chrome扩展程序以解析某些网站。我遇到了一个网站,其内容由内联/外部js代码生成(我想!)。我该如何解析这类网站。我试图通过解析器中的XMLHttpRequest()
提取整个页面。我尝试使用Jquery的eval()
和html()
。使用Jquery,我可以解析一些元素,但不准确。
我的解析器的示例代码:
var siteaddress="www.xyz.com/search?q=abcd";
var req = new XMLHttpRequest()
req.open('GET',siteaddress,true)
parseHT(req,x);
req.send(null);
function parseHT(req_new,x){
req_new.onload=function(){
//console.log(this.responseText);
var jshtml=req_new.responseText;
var el = $( '<div></div>' );
html=el.html(jshtml)
//process steps follows this
由于