我试图以与语言环境相关的方式比较std::string
。
对于普通的C风格字符串,我在strcoll
std::setlocale
,它完全符合我的要求
#include <iostream>
#include <locale>
#include <cstring>
bool cmp(const char* a, const char* b)
{
return strcoll(a, b) < 0;
}
int main()
{
const char* s1 = "z", *s2 = "å", *s3 = "ä", *s4 = "ö";
std::cout << (cmp(s1,s2) && cmp(s2,s3) && cmp(s3,s4)) << "\n"; //Outputs 0
std::setlocale(LC_ALL, "sv_SE.UTF-8");
std::cout << (cmp(s1,s2) && cmp(s2,s3) && cmp(s3,s4)) << "\n"; //Outputs 1, like it should
return 0;
}
但是,我也希望std::string
也有这种行为。我可以重载operator<
来执行类似
bool operator<(const std::string& a, const std::string& b)
{
return strcoll(a.c_str(), b.c_str());
}
但是我不得不担心使用std::less
和std::string::compare
的代码,所以感觉不对。
有没有办法让这种校对以无缝方式为字符串工作?
答案 0 :(得分:8)
operator()就是您正在搜索的内容。要获取当前的全局语言环境,只需使用默认构造函数。
答案 1 :(得分:6)
C ++库提供collate facet来进行特定于语言环境的排序规则。
答案 2 :(得分:0)
经过一番搜索,我意识到一种方法可能是重载std::basic_string
模板以创建一个新的本地化字符串类。
这可能有很多错误,但作为概念的证明:
#include <iostream>
#include <locale>
#include <string>
struct localed_traits: public std::char_traits<wchar_t>
{
static bool lt(wchar_t a, wchar_t b)
{
const std::collate<wchar_t>& coll =
std::use_facet< std::collate<wchar_t> >(std::locale());
return coll.compare(&a, &a+1, &b, &b+1) < 0;
}
static int compare(const wchar_t* a, const wchar_t* b, size_t n)
{
const std::collate<wchar_t>& coll =
std::use_facet< std::collate<wchar_t> >(std::locale());
return coll.compare(a, a+n, b, b+n);
}
};
typedef std::basic_string<wchar_t, localed_traits> localed_string;
int main()
{
localed_string s1 = L"z", s2 = L"å", s3 = L"ä", s4 = L"ö";
std::cout << (s1 < s2 && s2 < s3 && s3 < s4 ) << "\n"; //Outputs 0
std::locale::global(std::locale("sv_SE.UTF-8"));
std::cout << (s1 < s2 && s2 < s3 && s3 < s4 ) << "\n"; //Outputs 1
return 0;
}
然而,如果您将其基于char
而不是wchar_t
,它似乎无效,我不知道为什么......
答案 3 :(得分:-1)
在C ++中,您需要使用标准的整理方面。 Check it out