我尝试使用请求模块和node.js实现Web scraper。有一段时间我需要发布一个表单,然后它总是重定向到我必须到达的其他地方继续报废。
var jarEstados = requestEstados.jar();
options = {
url: urlPrincipal,
method: 'POST',
followRedirect: true,
maxRedirects: 10,
followAllRedirect: true,
jar: jarEstados,
form: requestObject
};
requestEstados(options,function (error, response, html) {
if (!error) {
console.log(html);
}
else {
console.error(error);
}
});
响应:
<head><title>Object moved</title></head>
<body><h1>Object Moved</h1>This object may be found <a HREF="Resumo_Por_Estado_Municipio.asp">here</a>.</body>
headers:
{ 'cache-control': 'private',
'content-length': '152',
'content-type': 'text/html',
location: 'Resumo_Por_Estado_Municipio.asp',
server: 'Microsoft-IIS/8.5',
'x-powered-by': 'ASP.NET, ARR/2.5, ASP.NET',
'x-customname': 'ServidorANP',
'x-ua-compatible': 'IE=7',
date: 'Wed, 15 Jun 2016 16:08:42 GMT',
connection: 'close' },
statusCode: 302,
resquest doest允许重定向,即使配置为模块站点说&gt; Resquest Module
我做错了什么?无法解决这个问题!
答案 0 :(得分:0)
我自己做了这份工作。我想通过如果我使用302响应传递一些有效的用户代理,我可以手动地重新定向并保持列车在轨道上进行剩余的报废过程。