PhantomJs onResourceReceived URL解码问题

时间:2016-09-27 10:20:33

标签: web-scraping phantomjs urldecode

我正在PhantomJs中创建一个Web抓取机器人,我正在使用onResourceReceived来嗅探网站的请求并使用这个简单的代码检索它们:

page.onResourceReceived = function(response) 
{
    if (response.url.match("XXXXXXX")) 
    {

        console.log(response.url);
    }

};

我的问题是 response.url 会自动将数据更新为此网址解码版本。我需要检查一些参数,而不是接收这样的东西:

  

xxx.com ...&安培;事件= event20%2Cevent4 %% 2Cevent89%3D7%2Cevent50%2Cevent51%2Cevent52%2Cevent53%2Cevent54%2Cevent55%2Cevent56&安培; ...

我明白了

  

xxx.com?...& events = event20%2Cevent4%2Cevent89%3D7& ....

看起来当达到%3D时,它会削减该值并继续到下一个属性。

有没有办法访问此数据的原始版本? 非常感谢您的帮助。

0 个答案:

没有答案