谷歌翻译 - 获得非英语字符

时间:2009-09-27 15:15:17

标签: asp.net character-encoding

我正在使用谷歌翻译来翻译许多单词,然后使用以下代码存储在数据库中:

http://www.developerfusion.com/community/blog-entry/8391765/translate-text-in-c-using-google- translate/

string txt = Translator.TranslateText("Cosmetics", "en|sr"); Response.Write(txt);

翻译文本(字符串txt)在浏览器中正确显示:Козметика

但结果来源如下:Козметика

问题是我不想把这个产生的乱码字符串txt放在DB中,而是想放置'Козметика',就像我从TextBox输入那样做。 那么基本上是什么呢?

我想它必须对代码页和unicode编码做一些事情。

由于

丹尼尔

1 个答案:

答案 0 :(得分:4)

您获得的是文本中字符的HTML编码实体。每个字符都被编码为HTML entity,以便在浏览器中正确显示。

要将其反转回原始字符,您可以使用HttpUtility.HtmlDecode方法:

string encoded = "Козметика";
string decoded = HttpUtility.HtmlDecode(encoded);

这会将编码后的文本解码回Козметика