我正在尝试以编程方式从命令行NodeJS脚本在远程站点上提交表单(POST请求)并刮取返回数据。
远程表单为here。
当我通过浏览器提交时,它首先进入页面本身(在<form action>
中指定),该页面返回302状态代码,重定向到另一个页面,打印数据。
但是,当我以编程方式通过NodeJS发出POST请求时,我得到了200 Server Busy
个响应。我也尝试过PHP中的等效代码,但没有骰子。
我正在传递标题,Cookie和表单数据,以尝试模拟从Chrome网络检查员复制的浏览器请求。
var url = 'http://www.meteo.co.il/StationReportFast.aspx?ST_ID=120';
var request = require('request');
var jar = request.jar();
jar.setCookie(request.cookie("ASP.NET_SessionId=tsytqpkr04g5w2bfsu3fncbx"), url);
jar.setCookie(request.cookie("arp_scroll_position=177"), url);
//console.log(jar)
request.post(
url, {
form: {
'__EVENTTARGET' : '',
'__EVENTARGUMENT' : '',
'chkAll' : 'on',
'lstMonitors' : '%3CWebTree%3E%3CNodes%3E%3ClstMonitors_1%20Checked%3D%22true%22%3E%3C/lstMonitors_1%3E%3ClstMonitors_2%20Checked%3D%22true%22%3E%3C/lstMonitors_2%3E%3ClstMonitors_3%20Checked%3D%22true%22%3E%3C/lstMonitors_3%3E%3ClstMonitors_4%20Checked%3D%22true%22%3E%3C/lstMonitors_4%3E%3ClstMonitors_5%20Checked%3D%22true%22%3E%3C/lstMonitors_5%3E%3ClstMonitors_6%20Checked%3D%22true%22%3E%3C/lstMonitors_6%3E%3ClstMonitors_7%20Checked%3D%22true%22%3E%3C/lstMonitors_7%3E%3ClstMonitors_8%20Checked%3D%22true%22%3E%3C/lstMonitors_8%3E%3ClstMonitors_9%20Checked%3D%22true%22%3E%3C/lstMonitors_9%3E%3ClstMonitors_10%20Checked%3D%22true%22%3E%3C/lstMonitors_10%3E%3ClstMonitors_11%20Checked%3D%22true%22%3E%3C/lstMonitors_11%3E%3ClstMonitors_12%20Checked%3D%22true%22%3E%3C/lstMonitors_12%3E%3ClstMonitors_13%20Checked%3D%22true%22%3E%3C/lstMonitors_13%3E%3ClstMonitors_14%20Checked%3D%22true%22%3E%3C/lstMonitors_14%3E%3C/Nodes%3E%3C/WebTree%3E',
'RadioButtonList1' : '0',
'RadioButtonList2' : '0',
'BasicDatePicker1$TextBox' : '02/02/2015',
'txtStartTime' : '00:00',
'txtStartTime_p' : '2015-2-3-0-0-0-0',
'BasicDatePicker2$TextBox' : '03/02/2015',
'txtEndTime' : '00:00',
'txtEndTime_p' : '2015-2-3-0-0-0-0',
'ddlAvgType' : 'AVG',
'ddlTimeBase' : '60',
'btnGenerateReport' : 'הצג דוח',
'txtErrorMonitor' : 'אנא בחר לפחות מוניטור אחד',
'txtErrorTimeBase' : 'בחר בסיס זמן',
'txtError2Y' : 'Select2Monitors'
},
jar: jar,
headers: {
Accept: 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate',
Host: 'www.meteo.co.il',
Origin: 'http://www.meteo.co.il',
Referer: 'http://www.meteo.co.il/StationReportFast.aspx?ST_ID=120',
'Content-Type': 'application/x-www-form-urlencoded'
}
}, function (error, response, body) {
if (!error && response.statusCode == 200) {
console.log(body)
} //else {
console.log(arguments)
//}
}
);
我非常确定POST数据中的问题不是希伯来语。我创建了一个只打印标题和POST数据的测试服务器,这段代码很好地指向那里。
如何模拟此请求?
更新:我尝试了来自其他域的其他一些网址。 http://www.mop-zafon.org.il/csv/cgi-bin/picman.cgi有效,而http://www.mop-zafon.net/DynamicTable.aspx?G_ID=0没有。
使用URL查询字符串发出POST请求是否有问题?
答案 0 :(得分:1)
您是否在请求中发回VIEWSTATE字段?该网站似乎是在加密的初始页面请求时将其发送给您,并且可能包含CSRF保护。我尝试让脚本最初启动一个真正的页面请求,抓住隐藏元素的所有,然后提交回来看看你是否仍然得到200而不是302.
答案 1 :(得分:1)
事实证明它需要User-Agent
标头集。我想它只想发送到浏览器,而不是脚本。
我还需要使用suggested by Sean Baker方法包含__VIEWSTATE
表单数据。
最后,需要将followAllRedirects: true
添加到options对象中,使其遵循重定向。