如何使用C ++和ucs2将ucs4转换为ucs2到ucs4?

时间:2011-05-30 08:22:32

标签: c++ unicode character-encoding

是否有任何C ++方法支持此转换? 到现在为止我只填充字符'0'将ucs2转换为ucs4,这样安全吗? 谢谢!

2 个答案:

答案 0 :(得分:2)

这对UCS2来说是正确的,但这很可能不是你拥有的。如今,你更有可能遇到UTF-16。与UCS-2不同,UTF-16将Unicode字符编码为一个或两个16位单元。这是必要的,因为Unicode在其当前版本中具有超过65536个字符。

通常可以通过您的操作系统完成更复杂的转换,并且有几个(非标准)库提供相同的功能,例如: ICU。

答案 1 :(得分:0)

我有类似的东西。希望它会有所帮助:

String^ StringFromUCS4(const char32_t* element, int length)
{
    StringBuilder^ result = gcnew StringBuilder(length);
    const char32_t* pUCS4 = element;

    int characterCount = 0;
    while (*pUCS4 != 0)
    {
        wchar_t cUTF16;
        if (*pUCS4 < 0x10000)
        {
            cUTF16 = (wchar_t)*pUCS4;
        }
        else 
        {
            unsigned int t = *pUCS4 - 0x10000;
            unsigned int h = (((t << 12) >> 22) + 0xD800);
            unsigned int l = (((t << 22) >> 22) + 0xDC00);
            cUTF16 = (wchar_t)((h << 16) | (l & 0x0000FFFF));
        }

        result->Append((wchar_t)*pUCS4);

        characterCount++;
        if (characterCount >= length)
        {
            break;
        }

        pUCS4++;
    }

    return result->ToString();
}