字符串比较。你如何比较字符串与std :: wstring? WRT strcmp

时间:2009-10-07 01:46:26

标签: c++ string

我试图比较两种格式,我期望它们在某种程度上是兼容的,因为它们通常都是字符串。我试图用字符串和std :: wstring执行strcmp,并且我确信C ++大师知道,这根本就不会编译。有可能比较这两种类型吗?这里有简单的转换吗?

4 个答案:

答案 0 :(得分:9)

您需要将ISO {C}中的char*字符串 - “多字节”转换为{C}用语中的wchar_t*字符串 - “宽字符”。执行此操作的标准函数称为mbstowcs(“多字节字符串到宽字符串”)

注意:正如Steve在评论中指出的那样,这是一个C99函数,因此不符合ISO C ++,但C ++实现可能会支持它作为扩展。 MSVC和g ++都支持它。

因此使用:

const char* input = ...;

std::size_t output_size = std::mbstowcs(NULL, input, 0); // get length
std::vector<wchar_t> output_buffer(output_size);

// output_size is guaranteed to be >0 because of \0 at end
std::mbstowcs(&output_buffer[0], input, output_size);

std::wstring output(&output_buffer[0]);

一旦你有两个wstring,就像往常一样进行比较。请注意,这将使用当前系统区域设置进行转换(即在Windows上,这将是当前的“ANSI”代码页) - 通常这正是您想要的,但有时您需要处理特定的编码,在这种情况下上面不会这样做,你需要使用像iconv这样的东西。

修改

所有其他答案似乎都用于直接代码点转换(即字符串中每(wchar_t)c的等效char c)。这可能不适用于所有语言环境,但是如果例如您的char都是ASCII或Latin-1,而您的wchar_t是Unicode。如果您确定这是您真正想要的,最快的方法实际上是完全避免转换,并使用std::lexicographical_compare

#include <algorithm>

const char* s = ...;
std::wstring ws = ...;

const char* s_end = s + strlen(s);

bool is_ws_less_than_s = std::lexicographical_compare(ws.begin, ws.end(),
                                                      s, s_end());
bool is_s_less_than_ws = std::lexicographical_compare(s, s_end(),
                                                      ws.begin(), ws.end());
bool is_s_equal_to_ws = !is_ws_less_than_s && !is_s_less_than_ws;

如果您特别需要测试相等性,请使用std::equal进行长度检查:

#include <algorithm>

const char* s = ...;
std::wstring ws = ...;

std::size_t s_len = strlen(s);
bool are_equal =
    ws.length() == s_len &&
    std::equal(ws.begin(), ws.end(), s);

答案 1 :(得分:2)

将您的wstring转换为字符串。

wstring a = L"foobar";
string  b(a.begin(),a.end());

现在你可以使用b.c_str()或任何你喜欢的方式将它与任何char *进行比较。

char c[] = "foobar";
cout<<strcmp(b.c_str(),c)<<endl;

答案 2 :(得分:2)

首先,你必须问自己为什么要使用std :: wstring这是一个带有char *(cstring)的unicode格式,它是ansi。最佳实践是使用unicode,因为它允许您的应用程序国际化,但在大多数情况下使用混合没有多大意义。如果您希望您的cstrings是unicode,请使用wchar_t。如果您希望您的STL字符串是ansi,请使用std :: string。

现在回到你的问题。

您要做的第一件事是转换其中一个以匹配其他数据类型。

std::string std::wstring具有c_str功能

这里是函数定义

const char* std::string::c_str() const
const wchar_t* std::wstring::c_str() const

我不记得如何将char *转换为wchar_t *,反之亦然,但是在你这样做之后你可以使用strcmp。如果你谷歌你会找到一种方式。

你可以使用下面的函数将std :: wstring转换为std :: string然后c_str会给你char *你可以strcmp

#include <string>
#include <algorithm>

// Prototype for conversion functions
std::wstring StringToWString(const std::string& s);
std::string WStringToString(const std::wstring& s);

std::wstring StringToWString(const std::string& s)
{
std::wstring temp(s.length(),L' ');
std::copy(s.begin(), s.end(), temp.begin());
return temp; 
}


std::string WStringToString(const std::wstring& s)
{
std::string temp(s.length(), ' ');
std::copy(s.begin(), s.end(), temp.begin());
return temp; 
}

答案 3 :(得分:2)

快速而肮脏的方式是

if( std::wstring(your_char_ptr_string) == your_wstring)

我说脏了,因为它会创建一个临时字符串并将your_char复制到其中。但是,只要你没有紧张的循环,它就能正常工作。

请注意,wstring使用16位字符(即unicode - 65536个可能的字符),而char *往往是8位字符(Ascii,仅限拉丁语)。它们不一样,所以wstring - &gt; char *可能会失去准确性。

- 汤姆