我正在与Google Translate API进行通信。我可以发送我的请求并得到答案。唯一的问题是一些特殊字符被编码。例如:
“时钟”(EN)将被翻译为“ L'horloge ”(FR)
API会向我发送此文L\u0026#39;horloge
。如何将这种情况转换为unicode字符串?
答案 0 :(得分:4)
它是JSON unicode和HTML编码。
我建议你让superobject解码JSON: http://code.google.com/p/superobject/source/browse/#svn/trunk
uses msxml, HTTPapp, superobject;
var
xml: IXMLHTTPRequest;
begin
xml := CoXMLHTTP.Create;
xml.open('GET', 'http://www.googleapis.com/language/translate/v2? key=YOURAPIKEYHERE&q=The%20clock&source=en&target=fr', False, EmptyParam, EmptyParam);
xml.send('');
Caption := HTMLDecode(SO(xml.responseText) ['data.translations[0].translatedText'].AsString);
end;
答案 1 :(得分:2)
您可以使用以下功能解码它们:
function unescapeUTF8EscapeSeq($str) {
return preg_replace_callback("/\\\u([0-9a-f]{4})/i",
create_function('$matches',
'return html_entity_decode(\'&#x\'.$matches[1].\';\', ENT_QUOTES, \'UTF-8\');'
), $str);
}
如果您愿意,可以试用here