我试图弄清楚如何轻松发送HTTP / HTTPS请求以及处理gzip / deflate压缩响应以及Cookie的最佳方式。
我发现的最好的是https://github.com/mikeal/request来处理除压缩之外的所有。是否有一个模块或方法可以完成我所要求的一切?
如果没有,我可以以某种方式组合request和zlib吗?我试图将zlib和http.ServerRequest结合起来,但它失败了。
谢谢!
答案 0 :(得分:88)
对于最近遇到这种情况的人来说,请求库现在支持开箱即用的gzip解压缩。使用方法如下:
request(
{ method: 'GET'
, uri: 'http://www.google.com'
, gzip: true
}
, function (error, response, body) {
// body is the decompressed response body
console.log('server encoded the data as: ' + (response.headers['content-encoding'] || 'identity'))
console.log('the decoded data is: ' + body)
}
)
来自github自述文件https://github.com/request/request
gzip - 如果为true,请添加Accept-Encoding标头以请求压缩 来自服务器的内容编码(如果尚未存在)和解码 响应中支持的内容编码。注意:自动解码 对通过返回的正文数据执行响应内容 请求(通过请求流并传递给回调 功能)但不在响应流上执行(可从 响应事件)是未修改的http.IncomingMessage 可能包含压缩数据的对象。见下面的例子。
答案 1 :(得分:5)
这是一个枪击响应的工作示例
function gunzipJSON(response){
var gunzip = zlib.createGunzip();
var json = "";
gunzip.on('data', function(data){
json += data.toString();
});
gunzip.on('end', function(){
parseJSON(json);
});
response.pipe(gunzip);
}
答案 2 :(得分:3)
查看http://nodejs.org/docs/v0.6.0/api/zlib.html#examples
上的示例zlib现在内置于节点中。
答案 3 :(得分:1)
//functions.js:
var ce=require('cloneextend');
//console.log({aa:'bb',dd:new Date('10/10/2011')});
//console.log(ce.clone({aa:'bb',dd:new Date('10/10/2011')}));
exports.cloneextend=ce;
exports.clone=ce.clone;
exports.extend=ce.extend;
////////////request
var request1=require('request');
var Iconv=require('iconv').Iconv;
var iconv_utf8_to_latin = new Iconv('utf-8','iso-8859-1');
var iconv_iso8859_8i_to_utf8 = new Iconv('iso-8859-8','utf-8');
var iconv_utf8_to_iso8859_8i = new Iconv('utf-8','iso-8859-8');
exports.iconv_iso8859_8i_to_utf8=iconv_iso8859_8i_to_utf8;
exports.iconv_utf8_to_iso8859_8i=iconv_utf8_to_iso8859_8i;
var zlib=require('zlib');
function request_unzip(options,cb)
{
var enc=options.encoding;
options.encoding=null;
var r=request1(options)
.on('response',function(response)
{
var bufarr=[];
var errored=false;
switch (response.headers['content-encoding'])
{
// or, just use zlib.createUnzip() to handle both cases
case 'gzip':
case 'deflate':
if(response.headers['content-encoding']=='gzip')
var zpipe=zlib.createGunzip();
else
var zpipe=zlib.createInflate();
zpipe
.on('data', function(d){bufarr.push(d);})
.on('end', function(){ if(errored) return;errored=true; cb(null,response, enc?Buffer.concat(bufarr).toString(enc):Buffer.concat(bufarr) ); })
.on('error', function(err){ if(errored) return;errored=true; cb(err,response,null);});
response.pipe(zpipe);
response
.on('error', function(err){ if(errored) return;errored=true; cb(err,response,null);});
break;
default:
response
.on('data', function(d){bufarr.push(d);})
.on('end', function(){ if(errored) return;errored=true; cb(null,response, enc?Buffer.concat(bufarr).toString(enc):Buffer.concat(bufarr) ); })
.on('error', function(err){ if(errored) return;errored=true; cb(err,response,null);});
break;
}
});
return r;
}
function request(options,cb)// a request that fixes encoding
{
if(options.encoding=='iso-8859-8')
{
options.encoding='binary';
return request_unzip(options, function(error,request,data){
if(data===undefined||data===null)
{
data2=null;
cb(error,request,data2);
}
else
{
try{
cb(error,request,
iconv_iso8859_8i_to_utf8.convert(iconv_utf8_to_latin.convert(data)).toString('utf8') //conver buffer to string
);
}
catch(e)
{
data2=null;
error=e;
cb(error,request,data2);
}
}
});
}
else
return request_unzip(options,cb);
}
request.__proto__=request1;
exports.request=request;
ie9headers= // no var goes to global
{
followAllRedirects:true,
headers:
{
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Accept-Language": "he-IL,he;q=0.8,en-US;q=0.6,en;q=0.4",
"User-Agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.22 (KHTML, like Gecko) Chrome/25.0.1364.172 Safari/537.22",//"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0; Trident/5.0)",
"Accept-Charset": "windows-1255,utf-8;q=0.7,*;q=0.3",
"Accept-Encoding": "gzip,deflate,sdch"
}
}
///
example:
f=require('./function.js'); //goes global
function getsomething(cb){
function getit(){
f.request(f.extend({jar:j,url:myurl, headers:{Referer:url}, encoding:'UTF-8' },ie9headers),function(error,request,data)
{
if(error) setTimeout(getit,1000);
//console.log("data",data);
var parsed=myparse(data);
cb(parsed);
});}
getit();
}
答案 4 :(得分:1)
查看source code - 你必须在请求lib本身设置gzip
参数才能使gzip正常工作。不确定这是否是故意的,但这是当前的实施。不需要额外的标题。
var request = require('request');
request.gzip = true;
request({url: 'https://...'}, // use encoding:null for buffer instead of UTF8
function(error, response, body) { ... }
);
答案 5 :(得分:0)
这里的所有答案均不起作用,而我却又得到了原始字节,并且gzip
标志也不起作用。事实证明,您需要将编码设置为null
,以防止请求将响应转换为utf-8编码,而是保留二进制响应。
const request = require("request-promise-native");
const zlib = require("zlib");
const url = getURL("index.txt");
const dataByteBuffer = await request(url, { encoding: null });
const dataString = zlib.gunzipSync(response);