使用zlib1.2.7解压缩gzip数据,如何在压缩包中获取文件名

时间:2016-01-25 09:04:32

标签: c++ c gzip zlib

使用zlib版本1.2.7解压缩gzip数据,但我不知道如何在压缩包中获取文件的名称,或者你正在解压缩的那些。我找到的方法,看起来像读取所有数据到缓冲区,然后返回它。

像这样:

int gzdecompress(Byte *zdata, uLong nzdata, Byte *data, uLong *ndata)
{
    int err = 0;
    z_stream d_stream = {0}; /* decompression stream */
    static char dummy_head[2] = {
        0x8 + 0x7 * 0x10,
        (((0x8 + 0x7 * 0x10) * 0x100 + 30) / 31 * 31) & 0xFF,
    };
    d_stream.zalloc = NULL;
    d_stream.zfree = NULL;
    d_stream.opaque = NULL;
    d_stream.next_in  = zdata;
    d_stream.avail_in = 0;
    d_stream.next_out = data;
    //only set value "MAX_WBITS + 16" could be Uncompress file that have header or trailer text
    if(inflateInit2(&d_stream, MAX_WBITS + 16) != Z_OK) return -1;
    while(d_stream.total_out < *ndata && d_stream.total_in < nzdata) {
        d_stream.avail_in = d_stream.avail_out = 1; /* force small buffers */
        if((err = inflate(&d_stream, Z_NO_FLUSH)) == Z_STREAM_END) break;
        if(err != Z_OK) {
            if(err == Z_DATA_ERROR) {
                d_stream.next_in = (Bytef*) dummy_head;
                d_stream.avail_in = sizeof(dummy_head);
                if((err = inflate(&d_stream, Z_NO_FLUSH)) != Z_OK) {
                    return -1;
                }
            } else return -1;
        }
    }
    if(inflateEnd(&d_stream) != Z_OK) return -1;
    *ndata = d_stream.total_out;
    return 0;
}

使用示例:

// file you want to extract
filename = "D:\\gzfile";

// read file to buffer
ifstream infile(filename, ios::binary);
if(!infile)
{
    cerr<<"open error!"<<endl;
}
int begin = infile.tellg();
int end = begin;
int FileSize = 0;
infile.seekg(0,ios_base::end);
end = infile.tellg();
FileSize = end - begin;

char* buffer_bin = new char[FileSize];
char buffer_bin2 = new char[FileSize * 2];

infile.seekg(0,ios_base::beg);
for(int i=0;i<FileSize;i++)
    infile.read(&buffer_bin[i],sizeof(buffer_bin[i]));
infile.close( );

// uncompress 
uLong ts = (FileSize * 2);
gzdecompress((Byte*)buffer_bin, FileSize, (Byte*)buffer_bin2, &ts);

数组“buffer_bin2”获取提取的数据。属性“ts”是数据长度。

问题是,我不知道它的名字是什么,只有一个文件。我如何获得信息?

1 个答案:

答案 0 :(得分:1)

您的问题一点也不清楚,但如果您尝试获取存储在gzip标头中的文件名,那么您应该阅读zlib.h中的zlib文档。事实上,如果您计划以任何身份使用zlib,那将是个好主意。

在文档中,您会发现inflate...()函数将解压缩gzip数据,并且有inflateGetHeader()函数将返回gzip标头内容。

请注意,当gzip解压缩.gz文件时,除非明确要求,否则它甚至不会查看标题中的名称。 gzip将解压缩为.gz文件的名称,例如解压缩时foo.gz变为foo,即使gzip标头名称为bar也是如此。如果您使用gzip -dN foo.gz,则会将其称为bar。目前尚不清楚为什么你甚至关心gzip头中的名字是什么。