读写超过8位的符号

时间:2016-04-05 18:06:20

标签: c# file filestream zxing symbols

我正在尝试编写一个Encoded文件。该文件有9到12位符号。在编写文件时我猜它没有正确写入9位符号,因为我无法解码该文件。虽然文件中只有8位符号。一切正常。这是我写文件的方式

File.AppendAllText(outputFileName, WriteBackContent, ASCIIEncoding.Default);

使用ReadAllText函数调用进行读取也是如此。
去这儿的方法是什么?


我正在使用ZXing库使用RS编码器对我的文件进行编码。

 ReedSolomonEncoder enc = new ReedSolomonEncoder(GenericGF.AZTEC_DATA_12);//if i use AZTEC_DATA_8 it works fine beacuse symbol size is 8 bit
 int[] bytesAsInts = Array.ConvertAll(toBytes.ToArray(), c => (int)c);
 enc.encode(bytesAsInts, parity);
 byte[] bytes = bytesAsInts.Select(x => (byte)x).ToArray();
 string contentWithParity = (ASCIIEncoding.Default.GetString(bytes.ToArray()));
 WriteBackContent += contentWithParity;
 File.AppendAllText(outputFileName, WriteBackContent, ASCIIEncoding.Default);

在代码中,我正在使用AZTEC_DATA_12初始化我的编码器,这意味着12位符号。因为RS Encoder需要int数组,所以我将它转换为int数组。并且像这里一样写入文件。但它适用于8位符号的AZTEC_DATA_8,但不适用于AZTEC_DATA_12。

1 个答案:

答案 0 :(得分:3)

主要问题在于:

byte[] bytes = bytesAsInts.Select(x => (byte)x).ToArray();

在将单个整数转换为单个字节时,基本上丢弃了部分结果。

如果在调用encode()之后查看数组,可以看到某些数组元素的值大于255,因此它们不能表示为字节。但是,在上面引用的代码中,您将整数数组中的每个元素都转换为byte,在元素值大于255时更改该元素。

因此,要存储encode()的结果,必须将整数数组转换为字节数组,方式是不丢失或修改值。

为了在字节数组和整数数组之间进行这种转换,可以使用函数Buffer.BlockCopy()。有关如何使用此功能的示例是in this answer

使用答案中的样本和评论中的样本以及两个转换的答案:将字节数组转换为整数数组以传递给encode()函数并转换从encode()返回的整数数组函数返回一个字节数组。

以下是链接答案的示例代码:

// Convert byte array to integer array
byte[] result = new byte[intArray.Length * sizeof(int)];
Buffer.BlockCopy(intArray, 0, result, 0, result.Length);

// Convert integer array to byte array (with bugs fixed)
int bytesCount = byteArray.Length;
int intsCount = bytesCount / sizeof(int);
if (bytesCount % sizeof(int) != 0) intsCount++;
int[] result = new int[intsCount];            
Buffer.BlockCopy(byteArray, 0, result, 0, byteArray.Length);

现在关于将数据存储到文件中:不要通过Encoding.GetString()直接将数据转换为字符串。并非所有位序列都是任何给定字符集中字符的有效表示。因此,将随机字节的随机序列转换为字符串有时会失败。

相反,要么通过File.WriteAllBytes() / File.ReadAllBytes()将字节数组直接存储/读取到文件中,要么使用Convert.ToBase64()Convert.FromBase64()来处理base64编码的字符串表示形式字节数组。

这里结合了一些示例代码:

    ReedSolomonEncoder enc = new ReedSolomonEncoder(GenericGF.AZTEC_DATA_12);//if i use AZTEC_DATA_8 it works fine beacuse symbol size is 8 bit
    int[] bytesAsInts = Array.ConvertAll(toBytes.ToArray(), c => (int)c);
    enc.encode(bytesAsInts, parity);

    // Turn int array to byte array without loosing value
    byte[] bytes = new byte[bytesAsInts.Length * sizeof(int)];
    Buffer.BlockCopy(bytesAsInts, 0, bytes, 0, bytes.Length);

    // Write to file
    File.WriteAllBytes(outputFileName, bytes);

    // Read from file
    bytes = File.ReadAllBytes(outputFileName);            

    // Turn byte array to int array 
    int bytesCount = bytes.Length * 40;
    int intsCount = bytesCount / sizeof(int);
    if (bytesCount % sizeof(int) != 0) intsCount++;
    int[] dataAsInts = new int[intsCount];
    Buffer.BlockCopy(bytes, 0, dataAsInts, 0, bytes.Length);

    // Decoding
    ReedSolomonDecoder dec = new ReedSolomonDecoder(GenericGF.AZTEC_DATA_12);
    dec.decode(dataAsInts, parity);