为什么byte []不按预期进行字符串和返回工作

时间:2013-01-05 02:41:19

标签: c# byte

我有这段代码:

Int32 i1 = 14000000;
byte[] b = BitConverter.GetBytes(i1);
string s = System.Text.Encoding.UTF8.GetString(b);
byte[] b2 = System.Text.Encoding.UTF8.GetBytes(s);
Int32 i2 = BitConverter.ToInt32(b2,0);;

i2等于-272777233。 为什么不是输入值? (14000000)?

编辑:我要做的是将它附加到另一个字符串,然后我使用WriteAllText写入文件

5 个答案:

答案 0 :(得分:10)

您不应使用Encoding.GetString任意二进制数据转换为字符串。该方法仅适用于使用特定编码编码为二进制数据的文本。

相反,您希望使用能够可逆地表示任意二进制数据的文本表示。最常见的两种方法是base64和hex。 Base64是.NET中最简单的:

string base64 = Convert.ToBase64String(originalBytes);
...
byte[] recoveredBytes = Convert.FromBase64String(base64);

有几点需要注意:

  • 如果要将此字符串用作URL参数,则应使用web64的web安全版本;我不知道在.NET中直接支持它,但你可以很容易地找到解决方案
  • 如果您确实需要字符串格式的数据,那么您应该只执行 。如果您只是想将其写入文件或类似文件,最简单的方法是将其保存为二进制数据
  • Base64不是人类可读的;如果您希望人类能够以文本形式读取数据而无需额外的工具,请使用十六进制。 (有关将二进制数据转换为十六进制和后退的具体问题。)

答案 1 :(得分:9)

因为Encoding类不适合任何事情。如果“字符”(在UTF-8的情况下可能是几个字节)不是该特定字符集中的有效字符(在您的情况下为UTF-8),则它将使用替换字符

  

单个问号(U + 003F)

(资料来源:http://msdn.microsoft.com/en-us/library/ms404377.aspx#FallbackStrategy

有些情况下它只是一个?,例如在ASCII / CP437 / ISO 8859-1中,但有一种方法可供您选择如何处理它。 (见上面的链接)

例如,如果您尝试将(byte)128转换为ASCII:

string s = System.Text.Encoding.ASCII.GetString(new byte[] { 48, 128 }); // s = "0?"

然后将其转换回来:

byte[] b = System.Text.Encoding.ASCII.GetBytes(s); // b = new byte[] { 48, 63 }

您将获取原始字节数组。

这可以作为参考:Check if character exists in encoding


我无法想象你为什么需要将字节数组转换为字符串。这显然没有任何意义。假设你要写一个流,你可以直接写byte[]。如果您需要在某些文本表示中使用它,那么只需yourIntegerVar.ToString()将其转换为字符串并使用int.TryParse将其恢复即可。


修改

可以将字节数组写入文件,但是您不会将字节数组“连接”到字符串并使用惰性方法File.WriteAllText,因为它将会处理编码转换,您可能最终会在整个文件中出现问号?。相反,打开FileStream并使用FileStream.Write直接写入字节数组。或者,您可以使用BinaryWriter以二进制形式(也是字符串)直接写入整数,并使用其对应的BinaryReader将其读回。

示例:

FileStream fs;

fs = File.OpenWrite(@"C:\blah.dat");
BinaryWriter bw = new BinaryWriter(fs, Encoding.UTF8);
bw.Write((int)12345678);
bw.Write("This is a string in UTF-8 :)"); // Note that the binaryWriter also prefix the string with its length...
bw.Close();

fs = File.OpenRead(@"C:\blah.dat");
BinaryReader br = new BinaryReader(fs, Encoding.UTF8);
int myInt = br.ReadInt32();
string blah = br.ReadString(); // ...so that it can read it back.
br.Close();

此示例代码将生成一个与以下hexdump匹配的文件:

00  4e 61 bc 00 1c 54 68 69 73 20 69 73 20 61 20 73  Na¼..This is a s  
10  74 72 69 6e 67 20 69 6e 20 55 54 46 2d 38 20 3a  tring in UTF-8 :  
20  29                                               )   

请注意,BinaryWriter.Write(string)也会在字符串前面加上其长度,并在读回时依赖于它,因此使用文本编辑器编辑生成的文件是不合适的。 (你正在以二进制形式写一个整数,所以我希望这是可以接受的吗?)

答案 2 :(得分:4)

它无效,因为您正在向后使用编码。

编码用于将文本转换为字节,然后再返回文本。您不能采用任意字节并转换为文本。每个字符都有相应的字节模式,但每个字节模式都不会转换为字符。

如果您想要一种紧凑的方式将字节表示为文本,请使用base-64编码:

Int32 i1 = 14000000;
byte[] b = BitConverter.GetBytes(i1);
string s = Convert.ToBase64String(b);

byte[] b2 = Convert.FromBase64String(s);
Int32 i2 = BitConverter.ToInt32(b2, 0);

答案 3 :(得分:3)

如果您的目标是将整数存储为字符串然后返回整数,除非我遗漏了某些内容,否则以下内容就足够了:

int32 i1 = 1400000;
string s = il.ToString();
Int32 i2 = Int32.Parse(s);

答案 4 :(得分:1)

长话短说:

您需要一种将每个字节值映射到唯一字符的编码,反之亦然。 UTF8 字符的长度可以是 1 到 4 个字节,因此您不会存档该映射,您需要更基本的编码,如 ASCII。 不幸的是,原始 ASCII 没有这样做,它只是一个 7 位编码,只定义了较低的 128 个代码,上半部分(扩展代码)是特定于代码页的。要获得完整范围的翻译,您只需要完整的 8 位编码,例如代码页 437 或 850 或其他代码页:

Int32 i1 = 14000000;
byte[] b = BitConverter.GetBytes(i1);
string s = System.Text.Encoding.GetEncoding(437).GetString(b);
byte[] b2 = System.Text.Encoding.GetEncoding(437).GetBytes(s);
Int32 i2 = BitConverter.ToInt32(b2,0);