std :: hex和std :: setw无法使用某些字符串

时间:2017-01-13 11:25:29

标签: c++ string utf-8 hex

我要做的是将字符串的字节转换为十六进制格式 基于this answer(以及其他许多一致),我尝试了代码:

std::stringstream ss;
// print every char of the string as hex on 2 values
for (unsigned int i = 0; i < inputText.size(); ++i)
{
   ss << std::hex << std::setfill('0') << std::setw(2) << (int)inputText[i];
}

但是有些字符用UTF 8编码,它不起作用 对于Instance,在包含以UTF8编码的度数符号(°)的字符串中,结果为:ffffffc2ffffffb0而不是c2b0
现在我希望算法能够处理单个字节而不管它们的内容如何,​​而且结果似乎忽略了setw(2)参数。
为什么我会得到这样的结果?

1 个答案:

答案 0 :(得分:5)

正如Pete Becker已在评论中暗示的那样,将负值转换为更大的整数会将更高的位填充为“1”。解决方案是先将char转换为unsigned char,然后再将其转换为int

#include <string>
#include <iostream>
#include <iomanip>

int main()
{
    std::string inputText = "-12°C";
    // print every char of the string as hex on 2 values
    for (unsigned int i = 0; i < inputText.size(); ++i)
    {
       std::cout << std::hex << std::setfill('0')  
                 << std::setw(2) << (int)(unsigned char)inputText[i];
    }
}

setw设置最小宽度,不会截断更长的值。