Ifstream读取失败的特定大小(与文件大小无关)

时间:2015-09-02 18:20:21

标签: c++ ifstream

我正在尝试读取文件,但我意识到它会失败,因为我会尝试读取太多数据,即使文件比我想读的文件大得多。

文件是120 MB,我的ifstream失败了12967字节(即使它在12801开始表现得很奇怪。

以下代码说明了我的问题:

#include <fstream>
#include <iostream>
#include <Windows.h>

using std::ifstream;
using std::cout;

#define CORRECT_SIZE 12800
#define CORRECT_BUT_WIERD 12966
#define INCORRECT_SIZE 12967

bool check_error_bits(ifstream* f);

int main()
{
    ifstream myFile("myfile.txt");
    char c[CORRECT_SIZE];
    char c2[CORRECT_BUT_WIERD];
    char c3[INCORRECT_SIZE];

    /*
     * TEST A (works fine)
    */
    myFile.seekg(0, std::ios_base::beg);
    myFile.read(c, CORRECT_SIZE);
    check_error_bits(&myFile);
    cout << myFile.tellg() << std::endl; // Here, tellg() returns 12800

    /*
     * TEST B (works too, but acts wierd)
     */
    myFile.seekg(0, std::ios_base::beg);
    myFile.read(c2, CORRECT_BUT_WIERD);
    check_error_bits(&myFile);
    cout << myFile.tellg() << std::endl; // Here, tellg() returns 16896

    /*
     * TEST C (FAIL)
    */
    myFile.seekg(0, std::ios_base::beg);
    myFile.read(c3, INCORRECT_SIZE);
    check_error_bits(&myFile);
    cout << myFile.tellg() << std::endl; // Here, tellg() returns -1

    system("pause");
}

bool check_error_bits(ifstream* f)
{
    bool stop = false;

    if (f->eof())
    {
        char msg[500];
        strerror_s(msg, errno);
        cout << "1: " << msg << std::endl;
    }

    if (f->fail())
    {
        char msg[500];
        strerror_s(msg, errno);
        cout << "2: " << msg << std::endl;
        stop = true;
    }

    if (f->bad())
    {
        char msg[500];
        strerror_s(msg, errno);
        cout << "3: " << msg << std::endl;
        stop = true;
    }

    return stop;
}

尝试读取少于12800字节非常有效。从128001到12966,它工作(虽然我没有检查数据是否正确),但tellg()返回无意义。在12966之后,阅读完全失败。

该程序的控制台输出是:

12800
16896
1: No error
2: No error
-1
Press any key to continue . . .

任何帮助将不胜感激!

3 个答案:

答案 0 :(得分:5)

在Windows环境和文本文件中,值为26 = 0x1A = ^ Z的字符被视为“结束文件”。

因此,如果文件未以二进制形式打开,即使文件较大,也可以收到意外的eof。

请参阅维基百科“文件结束”(https://en.wikipedia.org/wiki/End-of-file):

在Microsoft的DOS和Windows(以及CP / M和许多DEC操作系统)中,从终端读取将永远不会产生EOF。相反,程序认识到源是终端(或其他“字符设备”)并将给定的保留字符或序列解释为文件结束指示符;最常见的是ASCII控制-Z,代码26。

答案 1 :(得分:2)

你有一个16,896字节的文件。第一次阅读工作正常。第二次读取遇到文件结尾,只能读取16,896字节。您的第三次读取失败,因为您没有清除流上的文件结束标记。

您可能还有一个120MB的文件,但这不相关。在代码中检查文件的大小。 (或者它可能是120MB的二进制数据,但您正在以文本模式阅读它。)

答案 2 :(得分:0)

你写了

  

(虽然我没有检查数据是否正确)

这样做,因为我认为数据是正确的。

我假设您正在使用Windows,因此: Why can't Explorer decide what size a file is?

https://superuser.com/questions/567175/why-is-the-folder-size-in-properties-different-from-the-total-file-folder-size