如何计算文件中的字符,行和单词

时间:2013-09-06 00:12:29

标签: c++

我正在尝试使用以下函数计算文件中的字符数和行数。

void characterCount(ifstream& inf, string fName, int length [])
{       

    int charNum = 0;
    int lineNum = 0;

char character;

inf.get(character);
while (!inf.eof())
{
    // counts a line when an endline character is counted
    if (character = '\n')
        ++lineNum;      

    charNum++;
    inf.get(character);

    if (character = EOF)
        break;
}

inf.close();
inf.clear();

wordTabulate(inf, charNum, lineNum, length, fName);
}

void wordTabulate(ifstream& inf, int charNum, int lineNum, int count [], string fName)
{
inf.open(fName);
string word;
while (inf >> word)
{
    cout << word;
    count[word.size()]++;
}

inf.close();
inf.clear();
inf.open(fName);

output (inf, charNum, lineNum, count);
}

不幸的是,它只会计算1行,1个字符,并且不会根据大小对单词进行分类。我为它写的所有其他功能似乎工作正常。我为角色计数器尝试了各种不同的东西,但似乎没有任何效果。非常感谢您提供的任何帮助。

下面我添加了输出功能。我确信从阵列输出有更好的方法,但我现在对此并不太担心。

void output(ifstream& inf, int charNum, int lineNum, int count [])
{
int words = 0;
cout << "Characters: " << charNum << endl;

words = totalWord(count);

cout << "Words: " << words << endl;

cout << "Paragraphs: " << lineNum << endl;

cout << "Analysis of Words: " << endl;

cout << "Size    1 2 3 4 5 6 7 8 9 10+" << endl;

cout << "#Words" << count [2], count [3], count [4], count [5], 
                    count [6], count [7], count [8], count [9], count [10];
}

这是我认为是罪魁祸首的开放文件功能。

bool fileOpen(string fileName, ifstream& inf, int wordTypes [])
{
int charNum = 0;
int lineNum = 0;
cout << "File? >" << endl;                  // asks for file name
cin >> fileName;                            

// opens file and indicates if file can be opened
bool Repeat ();                             
{
    inf.open(fileName.c_str());  

    if (inf.is_open())
    {
        return true;
    }

    if (!inf.is_open())
    {
        return false;
    }
} 
} 

1 个答案:

答案 0 :(得分:2)

第一个循环中的问题是您没有读取循环中的字符,也尝试使用eof()作为结束条件。两者都不起作用。您总是需要检查之后读取您是否已成功阅读该实体,并且eof()不是您要查找的条件。你的循环应该有这样的条件:

for (char value; in.get(value); ) {
    ...
}

上面的循环将读取文件中的所有字符,并且无需处理EOF特殊字符。也就是说,我总是喜欢这个问题的建设性解决方案。这是我的:

void count(std::istream& in, int& chars, int& words, int& lines)
{
    bool word(false);
    std::for_each(std::istreambuf_iterator<char>(in),
                  std::istreambuf_iterator<char>(),
                  [&](unsigned char c) {
                      word = !std::isspace((++chars, c))
                          && (word || ++words);
                      c == '\n' && ++lines; });
}