在C中打印unicode字符串

时间:2013-11-11 10:48:05

标签: c windows unicode printf

我的文件包含以下句子:returnCodeMsgDE=Es gibt nicht genug Arbeitsspeicher um das Programm auszuf\u00FChren. Zurzeit gibt es %d frei MB zu verf\u00FCgung

我想阅读这些句子,将它们写入一个将传递给MessageBox的变量,因此我可以将它们写入一个对话框窗口,其中unicode符号应该用它​​们的unicode等效的本地字符替换。

但是我得到的对话框是这样的文字:“auszuf \ u00FChren”。

这是我的代码中发生这种情况的部分:

_TCHAR*   errorMsg = NULL;

_TCHAR* returnCodeMsgDE2 = readPropertiesFile(_T_ECLIPSE("returnDE")); //here I get this string: L"returnCodeMsgDE=Es gibt nicht genug Arbeitsspeicher um das Programm auszuf\\u00FChren. Zurzeit gibt es %d frei MB zu verf\\u00FCgung"

_stprintf(errorMsg, _T_ECLIPSE("%s"), returnCodeMsgDE2, _freeMemory()); //freememory() returns an Integer.


MessageBox( topWindow, errorMsg, title, MB_OK );

我不知道如何使我的程序正确表示Unicode符号,我已经尝试了很多printf和scanf unicode版本,但没有一个可以工作。

我也尝试过设置区域设置。

你可以帮帮我吗?我此刻完全迷失了。

1 个答案:

答案 0 :(得分:1)

您收到的字符串是L"auszuf\\u00FChren",以C源代码表示,其名称为“auszuf \ u00FChren”。

您需要额外的一层unescaping,以便将序列\u00FC转换为变音符号ü。下面的例子为C语言中的UNICODE和ASCII构建实现了(非常粗略的)非字符串机制,用于C字符串语法:

#include <windows.h>

#ifdef UNICODE
#define stprintf swprintf
#else
#define stprintf sprintf
#endif

static int hexdigit(TCHAR c)
{
    if ('0' <= c && c <= '9') return c - '0';
    if ('a' <= c && c <= 'f') return c - 'a' + 10;
    if ('A' <= c && c <= 'F') return c - 'A' + 10;
    return -1;
}

static TCHAR hexcode(TCHAR const **p, int n)
{
    TCHAR uc = 0;

    while (n--) {
        int d = hexdigit(*(*p)++);

        if (d < 0) return 0xfffd;
        uc = (uc << 4) + d;
    }
    return uc;
}

/*
 *      Resolve C escapes in src and write up to n - 1 characters 
 *      to str, which is zero-terminated. Returns number of 
 *      characters in str, not counting the trailing NUL.
 */
int unescape(TCHAR *str, int n, const TCHAR *src)
{
    TCHAR *p = str;
    TCHAR *end = p + n - 1;

    while (*src) {
        if (p == end) break;

        if (*src == '\\') {
            src++;

            switch (*src++) {
            case 'n':   *p++ = '\n'; break;
            case 't':   *p++ = '\t'; break;
            case '\\':  *p++ = '\\'; break;
            case '\'':  *p++ = '\''; break;
            case '"':   *p++ = '\"'; break;
            case '0':   *p++ = '\0'; break;            
            case 'x':   *p++ = hexcode(&src, 2); break;                         
            case 'u':   *p++ = hexcode(&src, 4); break;

            /* Ignore octal notation and non-printable chars */
            }
        } else {
            *p++ = *src++;
        }
    }

    *p = '\0';
    return p - str;
}

#define MAXBUF 80

int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, 
    LPSTR lpCmdLine, int nCmdShow)
{
    TCHAR *title_esc = TEXT("Speicherplatz ungen\\u00FCgend");
    TCHAR *fmt_esc = TEXT("Es stehen nur %d MB zur Verf\\u00FCgung!");
    TCHAR title[MAXBUF];
    TCHAR fmt[MAXBUF];
    TCHAR msg[MAXBUF];

    unescape(title, MAXBUF, title_esc);
    unescape(fmt, MAXBUF, fmt_esc);
    stprintf(msg, fmt, 17);

    MessageBox(NULL, msg, title, MB_OK);
    return 0;
}

可能已经有了一个更清洁,更好实现的API函数,但我找不到它。