有关UTF16和WCS之间转换的Unicode ICU4C问题(仅限OS-X)

时间:2011-10-19 13:12:47

标签: macos unicode globalization icu

我在Windows,Linux和Mac-OSX下构建的C ++软件中使用ICU4C。 我只在Mac-OSX下有一个问题,只与UTF16和WCS之间的转换有关(调用u_strToWCS)。 只需将unicoded字符替换为固定字符。

ICU4C版本并不重要:我昨天尝试了最新版本。

我的Mac OS-X是10.6.6(Snow Leopard),GCC:i686-apple-darwin10-gcc-4.2.1。

我也尝试在共享库和静态库之间切换,而不做任何更改。

我使用下面的代码重现了这个问题。查看变量“c1”,“c2”和“c3”:Windows和Linux给出了相同的结果,Mac OS-X没有(我的问题)。

我不明白是编译问题,还是icu bug或whatelse。

我希望任何人都可以向我建议一个方向,或至少确认我的测试结果。

感谢。

    // Manually construct UTF16 buffer of this string: http://pastebin.com/HW06TaA9
    unsigned char* pSource = new unsigned char[28];
    pSource[0] = 84;
    pSource[1] = 0;
    pSource[2] = 101;
    pSource[3] = 0;
    pSource[4] = 115;
    pSource[5] = 0;
    pSource[6] = 116;
    pSource[7] = 0;
    pSource[8] = 32;
    pSource[9] = 0;
    pSource[10] = 179;
    pSource[11] = 111;
    pSource[12] = 128;
    pSource[13] = 149;
    pSource[14] = 121;
    pSource[15] = 114;
    pSource[16] = 43;
    pSource[17] = 82;
    pSource[18] = 76;
    pSource[19] = 136;
    pSource[20] = 63;
    pSource[21] = 101;
    pSource[22] = 64;
    pSource[23] = 83;
    pSource[24] = 125;
    pSource[25] = 0;
    pSource[26] = 0;
    pSource[27] = 0;

    int32_t nChars = 100;
    wchar_t* pDest = new wchar_t[nChars];
    memset(pDest, 0, nChars * sizeof(wchar_t));

    UErrorCode status = U_ZERO_ERROR;
    u_strToWCS(pDest, nChars, &nChars, (const UChar*) pSource, -1, &status);
    if(U_SUCCESS(status))
    {
        wchar_t c1 = pDest[2];  // Ascii char. Win: 115, Linux: 115, OS-X: 115 
        wchar_t c2 = pDest[5];  // Japan char. Win: 28595, Linux: 28595, OS-X: 26
        wchar_t c3 = pDest[6];   // Japan char. Win: 38272, Linux: 38272, OS-X: 26
    }

1 个答案:

答案 0 :(得分:0)

看到这个错误。这已经在最新的ICU中得到修复,我已经包含了一个解决方法。 https://ssl.icu-project.org/trac/ticket/8894#comment:4