C ++以二进制流的形式读取文件,在中间随机跳过字节

时间:2014-10-31 20:15:28

标签: android c++ serialization fstream

std::ifstream infile;
infile.open(fullfilename, std::ios::binary);
std::vector<unsigned char> byteVect;
if (!infile.fail()) {
    infile.seekg(0, std::ios_base::end);
    int flsz = infile.tellg();
    LOG("sz=%d, infile.fail() returned %d", flsz, infile.fail());
    infile.seekg(0, std::ios_base::beg);
    while (!infile.eof()) {
        unsigned char byte;
        infile >> byte;
        if (infile.fail()) break;
        byteVect.push_back(byte);
    }
    infile.close();
    LOG("Loaded %d bytes into buffer", byteVect.size());

然后我用我最喜欢的自制库函数将缓冲区记录到logcat。很多零,但它仍然是早期的门。

问题是并非所有字节都以这种方式读取。我在流的中间找到了一个丢失的字节,并且再次成功反序列化。我知道并非所有字节都被读取,因为有时(每当它失败时)flsz的第一个日志比byteVect.size()的下一个日志多一个。我知道它发生在中间,因为我正在观察输入和输出的十六进制(权力的游戏不是)。

我看不出我的代码有什么问题,但我之前只是坚持使用C风格fopen fread fwrite,但我认为是时候进化了。我相信你会在我的循环算法中发现一百万个漏洞,但我正在学习。谢谢你的东西。

1 个答案:

答案 0 :(得分:2)

此代码存在很多问题。主要原因是eof()上的循环通常是错误的 (SEE THIS POST) ,对于二进制输入,您不应使用>>。您应该使用read() (Reference) ,因为>>会跳过空格并可能会更改行结束字符。

以下是我将如何完成这项任务:

int main()
{
    std::vector<unsigned char> byteVect;

    std::ifstream infile;

    // open file at the end (to get its length)
    infile.open("test.txt", std::ios::binary|std::ios::ate);

    if(!infile.is_open())
    {
        std::cerr << "Error opening file: " << "" << std::endl;
        return 1;
    }

    // tellg() gives is the file position
    // (and therefore length)
    byteVect.resize(infile.tellg()); // make our vector big enough

    if(!byteVect.empty())
    {
        infile.seekg(0); // move file position back to beginning

        if(!infile.read((char*)&byteVect[0], byteVect.size()))
        {
            std::cerr << "Error reading file: " << "" << std::endl;
            return 1;
        }
    }

    infile.close();

    std::cout << "Loaded " << byteVect.size() << " bytes into vector." << '\n';
}