霍夫曼压缩读取文件不会复制二进制文件c ++中的所有字节

时间:2016-05-03 06:44:43

标签: c++ huffman-code

我的程序是Huffman压缩,一切都很好,除了一件烦人的事情。 当我从压缩文件中读取字节时,只有大约三分之一的字节被复制并解压缩(返回到普通文本)。 我真的不知道问题出在哪里。 这是从文件中读取字节并将其返回到STL容器的函数:

template<class Container>
Container readcompressfile(string ifileloc) {
    ifstream ifile(ifileloc);

    if (!ifile) {
        throw runtime_error("Could not open " + ifileloc + " for reading");
    }

    noskipws(ifile);

    return Container(istream_iterator<uint8_t>(ifile), istream_iterator<uint8_t>());
}

以下是我在我的解压缩函数中调用它的方式(调用我包含的另一个函数,如果它很重要)(在类中):

void decompressfile(string loc) {
        vector<uint8_t> vecbytes(readcompressfile<vector<uint8_t>>(ifilelocation)); // Here is where I'm using the above function

        vector<uint8_t>::iterator iter = vecbytes.begin();

        uint8_t ctr = 0xFF;
        bitset<8> b2 = 0;
        string code = "";

        for (; iter != vecbytes.end(); ++iter) {
            b2 = ctr & *iter;

            for (int i = 7; i >= 0; i--) {
                code += to_string(b2[i]);
            }
        }

        decodetext(code, loc);
    }

    //Reads bits and outputs string
    void decodetext(string codetext, string ofileloc) {
        string code = "";
        string text = "";
        char lett;

        for each (char ct in codetext) {
            code += ct;
            lett = returncharmap(code);
            if (lett != NULL) {
                text += lett;
                code = "";
            }
        }

        ofstream ofile(ofileloc);
        ofile << text;
        ofile.close();
    }

压缩功能将一个1和0的字符串转换为位(我将它们打包成字节),然后将其存储在文件中(工作正常),就像你的解压缩一样#39;我注意到我在readcompressfile(string ifileloc)函数中读取了二进制文件,然后将其放在vector<uint8_t>容器中,然后将其转换回1和0的字符串,并且再次返回文本,并且复制的字节被解压缩得很好。

I displayed the size of the string before and after and here is the result

注意:我在stackoverflow上从某人那里复制了readcompressfile(string ifileloc)函数,因为它解决了我之前遇到的问题。

1 个答案:

答案 0 :(得分:3)

我猜你正在Windows上运行,它会将文本流中的^Z字符(这是ifstream的默认模式)解释为文件结尾指示器。

而不是:

 ifstream ifile(ifileloc);

使用:

 ifstream ifile(ifileloc, ifstream::in | ifstream::binary);

正如下面的评论所指出的,Windows平台还会在文本模式下将"\r\n"字符序列转换为单个字符"\n"