表达字节值> 127 in .Net Strings

时间:2013-08-08 16:34:49

标签: c# .net string character-encoding

我正在使用字符串在.Net中编写一些二进制协议消息,除了一个特定情况外,它主要是

我要发送的邮件是:

String cmdPacket = "\xFD\x0B\x16MBEPEXE1.";  
myDevice.Write(Encoding.ASCII.GetBytes(cmdPacket));

(为了帮助解码,这些字节是253,11,22,然后是ASCII字符:"MBEPEXE1.")。

除了我Encoding.ASCII.GetBytes时,0xFD以字节0x3F的形式出现 (值253变为63)。

(我应该指出\x0B\x16被正确解释为Hex 0B& Hex 16

我也尝试了Encoding.UTF8Encoding.UTF7,但无济于事。

我觉得在Strings中表达128以上的值可能是一种很好的简单方法,并将它们转换为字节,但我很想念它。

任何指导?

4 个答案:

答案 0 :(得分:3)

忽略你正在做的事情的好坏,编码ISO-8859-1将其所有字符映射到Unicode中具有相同代码的字符。

// Bytes with all the possible values 0-255
var bytes = Enumerable.Range(0, 256).Select(p => (byte)p).ToArray();

// String containing the values
var all1bytechars = new string(bytes.Select(p => (char)p).ToArray());

// Sanity check
Debug.Assert(all1bytechars.Length == 256);

// The encoder, you could make it static readonly
var enc = Encoding.GetEncoding("ISO-8859-1"); // It is the codepage 28591

// string-to-bytes
var bytes2 = enc.GetBytes(all1bytechars);

// bytes-to-string
var all1bytechars2 = enc.GetString(bytes);

// check string-to-bytes
Debug.Assert(bytes.SequenceEqual(bytes2));

// check bytes-to-string
Debug.Assert(all1bytechars.SequenceEqual(all1bytechars2));

来自wiki

  

ISO-8859-1被纳入ISO / IEC 10646和Unicode的前256个代码点。

string转换为byte[]uncheckedchecked变体)的简单快捷方法

public static byte[] StringToBytes(string str)
{
    var bytes = new byte[str.Length];

    for (int i = 0; i < str.Length; i++)
    {
        bytes[i] = checked((byte)str[i]); // Slower but throws OverflowException if there is an invalid character
        //bytes[i] = unchecked((byte)str[i]); // Faster
    }

    return bytes;
}

答案 1 :(得分:2)

ASCII是一个7位代码。高阶位曾用作奇偶校验位,因此“ASCII”可以具有偶数,奇数或无奇偶校验。您可能会注意到0x3F(十进制63)是ASCII字符?。这就是非ASCII八位字节(大于0x7F /十进制127)通过CLR的ASCII编码转换成的字符串。原因是0x80-0xFF范围内的代码点没有标准的 ASCII 字符表示。

C#字符串在内部是UTF-16编码的Unicode。如果您关心的是字符串的字节值,并且您知道字符串实际上是Unicode代码点在U+0000U+00FF范围内的字符,则很容易。 Unicode的前256个代码点(0x00-0xFF),Unicode块C0 Controls and Basic Latin(\ x00- \ x7F)和C1 Controls and Latin Supplement(\ x80- \ xFF)是“普通”ISO-8859-1字符。像这样简单的咒语:

String cmdPacket = "\xFD\x0B\x16MBEPEXE1.";  
byte[] buffer = cmdPacket.Select(c=>(byte)c).ToArray() ;
myDevice.Write(buffer);

将为您提供所需的byte[],在这种情况下

// \xFD   \x0B   \x16   M      B      E     P      E      X      E      1      .
[  0xFD , 0x0B , 0x16 , 0x4d , 0x42 , 0x45, 0x50 , 0x45 , 0x58 , 0x45 , 0x31 , 0x2E ]

答案 2 :(得分:1)

使用LINQ,您可以执行以下操作:

String cmdPacket = "\xFD\x0B\x16MBEPEXE1.";  
myDevice.Write(cmdPacket.Select(Convert.ToByte).ToArray());

修改 添加了解释

首先,您认识到您的字符串实际上只是一个字符数组。你想要的是一个等同的&#34;字节数组,其中每个字节对应一个字符。

要获得数组,您必须&#34; map&#34;原始数组的每个字符作为新数组中的一个字节。为此,您可以使用内置的System.Convert.ToByte(char)方法。

一旦你描述了从字符到字节的映射,它就像通过映射将输入字符串投影到数组一样简单。

希望有所帮助!

答案 3 :(得分:0)

我使用的是Windows-1252,因为它似乎为字节提供了最大的亮点 并且兼容所有.NET字符串值
你可能想要评论ToLower
这是为了与SQL char(单字节)

兼容而构建的
namespace String1byte
{
    /// <summary>
    /// Interaction logic for MainWindow.xaml
    /// </summary>
    public partial class MainWindow : Window
    {
        public MainWindow()
        {
            InitializeComponent();
            String8bit s1 = new String8bit("cat");
            String8bit s2 = new String8bit("cat");
            String8bit s3 = new String8bit("\xFD\x0B\x16MBEPEXE1.");
            HashSet<String8bit> hs = new HashSet<String8bit>();
            hs.Add(s1);
            hs.Add(s2);
            hs.Add(s3);
            System.Diagnostics.Debug.WriteLine(hs.Count.ToString());
            System.Diagnostics.Debug.WriteLine(s1.Value + " " + s1.GetHashCode().ToString());
            System.Diagnostics.Debug.WriteLine(s2.Value + " " + s2.GetHashCode().ToString());
            System.Diagnostics.Debug.WriteLine(s3.Value + " " + s3.GetHashCode().ToString());
            System.Diagnostics.Debug.WriteLine(s1.Equals(s2).ToString());
            System.Diagnostics.Debug.WriteLine(s1.Equals(s3).ToString());
            System.Diagnostics.Debug.WriteLine(s1.MatchStart("ca").ToString());
            System.Diagnostics.Debug.WriteLine(s3.MatchStart("ca").ToString());
        }
    }

    public struct String8bit
    {
        private static Encoding EncodingUnicode = Encoding.Unicode;
        private static Encoding EncodingWin1252 = System.Text.Encoding.GetEncoding("Windows-1252");
        private byte[] bytes;
        public override bool Equals(Object obj)
        {
            // Check for null values and compare run-time types.
            if (obj == null) return false;
            if (!(obj is String8bit)) return false;
            String8bit comp = (String8bit)obj;
            if (comp.Bytes.Length != this.Bytes.Length) return false;
            for (Int32 i = 0; i < comp.Bytes.Length; i++)
            {
                if (comp.Bytes[i] != this.Bytes[i])
                    return false;
            }
            return true;
        }
        public override int GetHashCode()
        {
            UInt32 hash = (UInt32)(Bytes[0]); 
            for (Int32 i = 1; i < Bytes.Length; i++) hash = hash ^ (UInt32)(Bytes[0] << (i%4)*8);
            return (Int32)hash;
        }
        public bool MatchStart(string start)
        {
            if (string.IsNullOrEmpty(start)) return false;
            if (start.Length > this.Length) return false;
            start = start.ToLowerInvariant();   // SQL is case insensitive
            // Convert the string into a byte array
            byte[] unicodeBytes = EncodingUnicode.GetBytes(start);
            // Perform the conversion from one encoding to the other 
            byte[] win1252Bytes = Encoding.Convert(EncodingUnicode, EncodingWin1252, unicodeBytes);
            for (Int32 i = 0; i < win1252Bytes.Length; i++) if (Bytes[i] != win1252Bytes[i]) return false;
            return true;
        }
        public byte[] Bytes { get { return bytes; } }
        public String Value { get { return EncodingWin1252.GetString(Bytes); } }
        public Int32 Length { get { return Bytes.Count(); } }
        public String8bit(string word)
        {
            word = word.ToLowerInvariant();     // SQL is case insensitive
            // Convert the string into a byte array 
            byte[] unicodeBytes = EncodingUnicode.GetBytes(word);
            // Perform the conversion from one encoding to the other 
            bytes = Encoding.Convert(EncodingUnicode, EncodingWin1252, unicodeBytes);
        }
        public String8bit(Byte[] win1252bytes)
        {   // if reading from SQL char then read as System.Data.SqlTypes.SqlBytes
            bytes = win1252bytes;
        }
    }
}