URL在C ++中编码扩展的ASCII std :: string

时间:2018-03-20 16:45:27

标签: javascript c++ windows urlencode extended-ascii

我的std::string填充了扩展的ASCII值(例如čáě)。我需要对此字符串进行URL编码,以便JavaScript与DecodeURIComponent进行解码。

我尝试通过windows-1252代码点将其转换为UTF-16然后转换为UTF-8,但由于MultiByteToWideChar没有足够的示例,因此无法将其转换为UTF-8和WideCharToMultiByte函数。

我正在使用Windows 10 64位上的MSVC-14.0进行编译。

我怎样才能至少迭代最终UTF-8字符串的各个字节,以便我进行URL编码?

由于

2 个答案:

答案 0 :(得分:1)

您可以使用MultiByteToWideChar将字符串转换为UTF-16,然后逐个编码字符。

示例代码:

std::string readData = "Extended ASCII characters (ěščřžýáíé)";
int size = MultiByteToWideChar(
    1252, //1252 corresponds with windows-1252 codepoint
    0,
    readData.c_str(),
    -1, //the string is null terminated, no need to pass the length
    NULL,
    0
);
wchar_t* wchar_cstr = new wchar_t[size];
MultiByteToWideChar(
    1252,
    0,
    readData.c_str(),
    -1,
    wchar_cstr,
    size
);
std::stringstream encodeStream;
for(uint32_t i = 0; i < size; i++){
    wchar_t wchar = wchar_cstr[i];
    uint16_t val = (uint16_t) wchar;
    encodeStream << "%" << std::setfill('0') << std::setw(2) << std::hex << val;
}
delete[] wchar_cstr;

std::string encodedString = encodeStream.str(); // the URL encoded string

虽然这确实编码了基本的ASCII字符(&lt; 128),但它完全可以被JavaScript解码,这是最终目标。

答案 1 :(得分:0)

我设法用非常简单的代码做到了。 下面是一个示例,将从文件中读取的 JSON 转换为 URL 并发送到外部网站以显示 JSON 中的语法错误(在 MS/Windows 上测试):

void EncodeJsonFileTextAndSendToExternalWebSiteToShowSyntaxErrors (const std::string &jsonTxt)
{
        std::stringstream encodeStream;
        for (char c : jsonTxt)
        {
            if (c>='0' && c<='9' || c>='a' && c<='z' || c>='A' && c<='Z' || strchr("{}();",c))
                encodeStream << c;
            else
                encodeStream << "%" << std::setfill('0') << std::setw(2) << std::hex << (int)c;
        }
        std::string url = "cmd /c start https://jsonlint.com/?json=" + encodeStream.str();
        system(url.c_str());
}

它会自动打开这样的网络浏览器:https://jsonlint.com/?json={%0a%22dataset%20name%22%3a%20%22CIHP%22%0alabel%2017%0a}