libcurl中的波兰变音符号(c ++)

时间:2014-08-24 23:47:43

标签: c++ windows libcurl

我只是遇到一个问题,其中包含来自服务器的libcurl获得的波兰变音符号(例如,ą,ć,ę,ł,ń,ó,ś,ź,ż)。我正在尝试在Windows C ++控制台应用程序中正确显示此文本。

我解决了类似的问题,把控制台屏幕放到这样的东西:

cout << "ąćęźół";

通过将我的源文件的代码页切换到:DOS Codepage 852(中欧)。不幸的是,从libcurl传递的文本不能解决问题。我认为它只适用于直接写入代码的文本。你能告诉我一些有用的信息吗?我不知道如何解决这个问题。

2 个答案:

答案 0 :(得分:1)

我已经为我的问题写了临时解决方案。它工作正常,但我不满足于这种方式:

char* cpl(const char* input)
{
        size_t length = strlen(input);
        char* output = new char[length+1];

        /*  Order of the diacretics
            Ą ą Ć ć Ę ę
            Ł ł Ń ń Ó ó
            Ś ś Ź ź Ż ż
        */
        const size_t pld_in[] = {
            0xA1,0xB1,0xC6,0xE6,0xCA,0xEA,
            0xA3,0xB3,0xD1,0xF1,0xD3,0xF3,
            0xA6,0xB6,0xAC,0xBC,0xAF,0xBF,
        };
        const size_t pld_out[] = {
            0xA4,0xA5,0x8F,0x86,0xA8,0xA9,
            0x9D,0x88,0xE3,0xE4,0xE0,0xA2,
            0x97,0x98,0x8D,0xAB,0xBD,0xBE
        };

        for(size_t i = 0; i < length; i++)
        {
            bool modified = false;
            for(size_t j = 0; j < 18; j++)
            {
                if(*(input + i) == (*(pld_in + j)) + 0xFFFFFF00)
                {
                    *(output + i) = *(pld_out + j);
                    modified = true;
                    break;
                }
            }
            if(!modified)
                *(output + i) = *(input + i);
        }
        *(output + length) = 0x00;

        return output;
}

你能否提出更好的解决方案,没有字符转换?

答案 1 :(得分:0)

libcurl返回的网页内容将使用网页的字符集。这里可能发生的事情是,它不是你的&#34;代码集&#34;所使用的字符集,我认为这是用于语言环境的MS-Windows术语。

libcurl应该让您查看从服务器收到的HTTP响应的标头。查看Content-Type:标头,它将指示返回文本使用的字符集;然后查找哪个代码页使用相同的字符集。