以下问题已从实际要求中简化。
考虑以下计划:
#include <iostream>
#include <iterator>
#include <string>
#include <set>
#include <algorithm>
using namespace std;
typedef string T; // to simplify, always consider T as string
template<typename input_iterator>
void do_something(const input_iterator& first, const input_iterator& last) {
const ostream_iterator<T> os(cout, "\n");
const set<T> words(first, last);
copy(words.begin(), words.end(), os);
}
int main(int argc, char** argv) {
const istream_iterator<T> is(cin), eof;
do_something(is, eof);
return 0;
}
该程序从istream
(cin
)中提取所有单词并对其执行某些操作。默认情况下,每个单词都由一个空格分隔。格式化提取背后的逻辑在istream_iterator
。
我现在需要做的是传递给do_something()
两个迭代器,以便提取的单词将用标点字符而不是空格分隔(白色空格将被视为“普通”字符)。您将如何以“干净的C ++方式”(即尽可能少的努力)做到这一点?
答案 0 :(得分:4)
虽然它不是先验明显的,但是有一种相对简单的方法来改变流认为是空白的内容。这样做的方法是imbue()
带有std::locale
对象的流,其std::ctype<char>
facet被替换为将所需字符视为空格。 imbue()
,locale
,ctype
- 嗯?!?好的,好吧,这些不一定是你日常使用的东西,所以这里有一个简单的例子,设置为std::cin
以逗号和换行符分隔:
#include <locale>
template <char S0, char S1>
struct commactype_base {
commactype_base(): table_() {
this->table_[static_cast<unsigned char>(S0)] = std::ctype_base::space;
this->table_[static_cast<unsigned char>(S1)] = std::ctype_base::space;
}
std::ctype<char>::mask table_[std::ctype<char>::table_size];
};
template <char S0, char S1 = S0>
struct ctype:
commactype_base<S0, S1>,
std::ctype<char>
{
ctype(): std::ctype<char>(this->table_, false) {}
};
实际上,std::ctype<char>
的这个特定实现实际上可以用来使用一个或两个任意char
作为空格(适当的C ++ 2011版本可能允许任意数量的参数;也,实际上不必是模板论证)。无论如何,有了这个,只需在main()
函数的开头放下以下行,就可以了:
std::cin.imbue(std::locale(std::locale(), new ::ctype<',', '\n'>));
请注意,这只会将,
和\n
视为空格字符。这也意味着不会跳过任何其他字符作为空格。 ...当然,一系列多个逗号字符被认为只是一个分隔符,而不是可能创建一堆空字符串。另请注意,上述std::ctype<char>
构面会删除所有其他字符分类。如果要解析除了字符串之外的其他对象,您可能希望保留其他字符分类,并仅更改空格。这是一种可以做到的方式:
template <char S0, char S1>
struct commactype_base {
commactype_base(): table_() {
std::transform(std::ctype<char>::classic_table(),
std::ctype<char>::classic_table() + std::ctype<char>::table_size,
this->table_,
[](std::ctype_base::mask m) -> std::ctype_base::mask {
return m & ~(std::ctype_base::space);
});
this->table_[static_cast<unsigned char>(S0)] |= std::ctype_base::space;
this->table_[static_cast<unsigned char>(S1)] |= std::ctype_base::space;
}
std::ctype<char>::mask table_[std::ctype<char>::table_size];
};
可悲的是,这与我在我的系统上使用的gcc版本崩溃(显然std::ctype<char>::classic_table()
会产生一个空指针。使用当前版本的clang编译它不起作用,因为clang不支持lambda。有了两个警告,上面的代码应该是正确的,但是......