Javascript和C#Unicode De- / Encode具有相同的结果

时间:2016-12-24 13:52:42

标签: javascript c# unicode encoding

我找到了这个信息丰富的帖子:

用于解码/编码unicode字符串的C#解决方案:

How do you convert Byte Array to Hexadecimal String, and vice versa?

用于解码/编码unicode字符串的Javascript解决方案:

Javascript: Unicode string to hex

但解决方案混合了字符。

示例Javascript(上面链接中的代码1:1):

var str = "그러하지";
hex = str.hexEncode(); // returns "adf8b7ecd558c9c0"

示例C#(尝试了2个解决方案,结果相同):

/// <summary>
/// Convert a string to hex value
/// </summary>
/// <param name="stringValue"></param>
/// <returns></returns>
public string HexEncode(string stringValue)
{
  var ba = Encoding.Unicode.GetBytes(stringValue);
  // SOLUTION 1
  //var c = new char[ba.Length * 2];
  //for (var i = 0; i < ba.Length; i++)
  //{
  //  var b = ba[i] >> 4;
  //  c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
  //  b = ba[i] & 0xF;
  //  c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
  //}
  //return new string(c);
  // SOLUTION 2
  var hex = new StringBuilder(ba.Length * 2);
  foreach (var b in ba)
    hex.AppendFormat("{0:x2}", b);
  return hex.ToString();
}

/// <summary>
/// Converts a hex value to a string
/// </summary>
/// <param name="hexString"></param>
/// <returns></returns>
public string HexDecode(string hexString)
{
  if (hexString == null || (hexString.Length & 1) == 1) return "";
  // SOLUTION 1
  //hexString = hexString.ToUpper();
  //var hexStringLength = hexString.Length;
  //var b = new byte[hexStringLength / 2];
  //for (var i = 0; i < hexStringLength; i += 2)
  //{
  //  var topChar = (hexString[i] > 0x40 ? hexString[i] - 0x37 : hexString[i] - 0x30) << 4;
  //  var bottomChar = hexString[i + 1] > 0x40 ? hexString[i + 1] - 0x37 : hexString[i + 1] - 0x30;
  //  b[i / 2] = Convert.ToByte(topChar + bottomChar);
  //}
  // SOLUTION 2
  var numberChars = hexString.Length;
  var bytes = new byte[numberChars / 2];
  for (var i = 0; i < numberChars; i += 2)
    bytes[i / 2] = Convert.ToByte(hexString.Substring(i, 2), 16);
  return Encoding.Unicode.GetString(bytes);
}


var hex = tools.HexEncode("그러하지");
var str = tools.HexDecode(hex); // f8adecb758d5c0c9
  • JS:adf8 b7ec d558 c9c0
  • C#:f8ad ecb7 58d5 c0c9

所以交换序列。 编码和解码都可以在同一环境中工作。但我需要在JS中编码并在C#中解码,反之亦然。

我不知道哪一个是正确的,如果正确可以在这里定义。 我该如何解决这个问题?

1 个答案:

答案 0 :(得分:2)

两个值都是正确的。只是你的javascript解决方案以Big Endian表示法给你unicode数组,而C# - 在Little Endian(MSDN article中,见Remarks部分)。 要像使用javascript一样使C#字节数组相同,请按以下方式定义编码:

UnicodeEncoding bigEndianUnicode = new UnicodeEncoding(true, true);

后来像这样使用它:

var ba = bigEndianUnicode.GetBytes(stringValue);

演示: .Net Fiddle