我必须处理包含“%C3%A7”等URL编码的字符串,我需要将这些序列转换为相应的可打印字符。因此我写了一个函数。它有效,但似乎相当尴尬。我是一个绝对的C / C ++初学者。也许有人可以指出我更优雅的解决方案。
#include <iostream>
using namespace std;
static inline void substitute_specials(string &str) {
const struct {string from,to;} substitutions[] { { "20"," " },{ "24","$" },{ "40","@" },{ "26","&" },{ "2C","," },{ "C3%A1","á" },{ "C3%A7","ç" },{ "C3%A9","é" } };
size_t start_pos = 0;
while ((start_pos = str.find("%", start_pos)) != string::npos) {
start_pos++;
for (int i=0; i< extent < decltype(substitutions) > ::value; i++) {
if (str.compare(start_pos,substitutions[i].from.length(),substitutions[i].from) == 0) {
str.replace(start_pos-1, substitutions[i].from.length()+1, substitutions[i].to);
start_pos += substitutions[i].to.length()-1;
break;
}
}
}
}
int main() {
string testString = "This%20is %C3%A1 test %24tring %C5ith %40 lot of spe%C3%A7ial%20charact%C3%A9rs%2C %26 worth many %24%24%24";
substitute_specials(testString);
cout << testString << "\n";
return 0;
}
编辑26.12.2016: 我仍然坚持这个问题。我找到了一些关于库和一些手工编写函数的建议,但是如果完全运行它们只会解码%xx(字符串中的2字节十六进制代码),如%20 = space。我没有找到任何可以做4字节代码,如%C3%84 =Ä我无法修改任何。 curl_easy_unescape library()也要求2字节代码。我发现我需要的是javascript中可用的,相应的函数是encodeURI()/ decodeURI(),请参阅http://www.w3schools.com/tags/ref_urlencode.asp decodeURI()的C / C ++源代码可能会解决我的问题。 https://dxr.mozilla.org/mozilla-central/source/js/src/jsstr.cpp中的第3829行看起来像是一个实现,但我无法提取我需要的东西。从我发现的其他示例中:许多人使用sscanf将2字节十六进制代码转换为使用%x hex格式的int,然后使用static_castint检索正确的char。如何修改4字节序列?我的功能的当前状态是
wstring url_decode2(char* SRC) {
wstring ret;
wchar_t ch;
int i, ii;
char sub[5];
for (i=0; i<strlen(SRC); i++) {
if (SRC[i]=='%') {
if ((SRC[i+3]=='%') && (SRC[i+1]>='A')) {
sub[0]=SRC[i+4];
sub[1]=SRC[i+5]; // ( also tried lsb/msb )
sub[2]=SRC[i+1]; // skip +3, it's %
sub[3]=SRC[i+2]; //
sub[4]='\0';
i=i+5;
} else {
sub[0]=SRC[i+1];
sub[1]=SRC[i+2];
sub[2]='\0';
i=i+2;
}
sscanf(&sub[0], "%x", &ii);
ch=static_cast<wchar_t>(ii);
ret+=ch;
} else
ret+=SRC[i];
}
return ret;
}
有人可以帮助我吗?
答案 0 :(得分:0)
我自己的问题的答案是这个unescape / undecode URI例程,它也处理2个和3个字节的序列:https://stackoverflow.com/a/41434414/4335480