将UTF-8字符串解码为Windows-1256

时间:2013-06-29 08:41:32

标签: c# encoding utf-8 decoding

我使用此代码将UTF-8字符串编码为Windows-1256字符串:

        string q = textBox1.Text;
        UTF7Encoding utf = new UTF7Encoding();

        byte[] winByte = Encoding.GetEncoding(1256).GetBytes(q);

        string result = utf.GetString(winByte);

此代码正常工作,但我无法解码结果或编码为原始字符串! 如何在转换之前将编码字符串(结果变量)解码为相同的(q变量)?

1 个答案:

答案 0 :(得分:4)

您正在错误地转换字符串。

查看下面的评论代码。评论解释了什么是错的,以及如何正确地做到这一点,但基本上发生的是:

首先,使用Encoding.GetEncoding(1256).GetBytes(q)将字符串(UTF16)转换为ANSI代码页1256字符串。

然后使用UTF7编码将其转换回来。但这是错误的,因为您需要使用ANSI代码页1256编码将其转换回来:

string q = "ABئبئ"; // UTF16.
UTF7Encoding utf = new UTF7Encoding(); // Used to convert UTF16 to/from UTF7

// Convert UTF16 to ANSI codepage 1256. winByte[] will be ANSI codepage 1256.
byte[] winByte = Encoding.GetEncoding(1256).GetBytes(q);

// Convert UTF7 to UTF16.
// But this is WRONG because winByte is ANSI codepage 1256, NOT UTF7!
string result = utf.GetString(winByte);

Debug.Assert(result != q); // So result doesn't equal q

// The CORRECT way to convert the ANSI string back:
// Convert ANSI codepage 1256 string to UTF16

result = Encoding.GetEncoding(1256).GetString(winByte);

Debug.Assert(result == q); // Now result DOES equal q