从istream读取格式化输入

时间:2012-01-27 01:27:33

标签: c++

以下问题已从实际要求中简化。

考虑以下计划:

#include <iostream>
#include <iterator>
#include <string>
#include <set>
#include <algorithm>

using namespace std;

typedef string T; // to simplify, always consider T as string

template<typename input_iterator>
void do_something(const input_iterator& first, const input_iterator& last) {
    const ostream_iterator<T> os(cout, "\n");
    const set<T> words(first, last);
    copy(words.begin(), words.end(), os);
}

int main(int argc, char** argv) {
    const istream_iterator<T> is(cin), eof;
    do_something(is, eof);
    return 0;
}

该程序从istreamcin)中提取所有单词并对其执行某些操作。默认情况下,每个单词都由一个空格分隔。格式化提取背后的逻辑在istream_iterator

我现在需要做的是传递给do_something()两个迭代器,以便提取的单词将用标点字符而不是空格分隔(白色空格将被视为“普通”字符)。您将如何以“干净的C ++方式”(即尽可能少的努力)做到这一点?

1 个答案:

答案 0 :(得分:4)

虽然它不是先验明显的,但是有一种相对简单的方法来改变流认为是空白的内容。这样做的方法是imbue()带有std::locale对象的流,其std::ctype<char> facet被替换为将所需字符视为空格。 imbue()localectype - 嗯?!?好的,好吧,这些不一定是你日常使用的东西,所以这里有一个简单的例子,设置为std::cin以逗号和换行符分隔:

#include <locale>
template <char S0, char S1>
struct commactype_base {
    commactype_base(): table_() {
        this->table_[static_cast<unsigned char>(S0)] = std::ctype_base::space;
        this->table_[static_cast<unsigned char>(S1)] = std::ctype_base::space;
    }
    std::ctype<char>::mask table_[std::ctype<char>::table_size];
};
template <char S0, char S1 = S0>
struct ctype:
    commactype_base<S0, S1>,
    std::ctype<char>
{
    ctype(): std::ctype<char>(this->table_, false) {}
};

实际上,std::ctype<char>的这个特定实现实际上可以用来使用一个或两个任意char作为空格(适当的C ++ 2011版本可能允许任意数量的参数;也,实际上不必是模板论证)。无论如何,有了这个,只需在main()函数的开头放下以下行,就可以了:

std::cin.imbue(std::locale(std::locale(), new ::ctype<',', '\n'>));

请注意,这只会将,\n视为空格字符。这也意味着不会跳过任何其他字符作为空格。 ...当然,一系列多个逗号字符被认为只是一个分隔符,而不是可能创建一堆空字符串。另请注意,上述std::ctype<char>构面会删除所有其他字符分类。如果要解析除了字符串之外的其他对象,您可能希望保留其他字符分类,并仅更改空格。这是一种可以做到的方式:

template <char S0, char S1>
struct commactype_base {
    commactype_base(): table_() {
        std::transform(std::ctype<char>::classic_table(),
                       std::ctype<char>::classic_table() + std::ctype<char>::table_size,
                       this->table_, 
                       [](std::ctype_base::mask m) -> std::ctype_base::mask {
                           return m & ~(std::ctype_base::space);
                       });
        this->table_[static_cast<unsigned char>(S0)] |= std::ctype_base::space;
        this->table_[static_cast<unsigned char>(S1)] |= std::ctype_base::space;
    }
    std::ctype<char>::mask table_[std::ctype<char>::table_size];
};

可悲的是,这与我在我的系统上使用的gcc版本崩溃(显然std::ctype<char>::classic_table()会产生一个空指针。使用当前版本的clang编译它不起作用,因为clang不支持lambda。有了两个警告,上面的代码应该是正确的,但是......