如何在写入文件时将HTML编码转换为UTF 8?

时间:2012-05-30 15:11:13

标签: c# .net string encoding character-encoding

  

可能重复:
  How can I decode HTML characters in C#?

我在将strToCheck下面的字符串从html编码版本转换为实际的UTF-8表示时遇到问题。

// Code sample:    
string result = null;

// HTML-encoded Input String (From Google Translate API) , renders "भारत महान देश है." in Hindi language.
string strTocheck = "भारत महान देश है.";

using (var sw = new StreamWriter(File.Open(@"c:\myfile.txt", FileMode.OpenOrCreate), Encoding.UTF8)) // UTF-8 encoding
{
    sw.WriteLine(strTocheck);
}

System.IO.StreamReader reader = new System.IO.StreamReader(@"c:\myfile.txt", Encoding.UTF8); // UTF-8 encoding
result = reader.ReadToEnd();
MessageBox.Show(result);

// I expected "भारत महान देश है."
// But got output : भारत महान देश है.

任何帮助都将受到高度赞赏。谢谢。

此处的图片(请在新标签中打开)>> http://i.stack.imgur.com/xcctU.png

1 个答案:

答案 0 :(得分:0)