标题不言而喻。我有一个文件包含base64编码byte[]
的可变宽度整数,最小8位,最大32位
我有一个大文件(48MB),我试图找到从流中抓取整数的最快方法。
这是来自perf应用程序的最快代码:
static int[] Base64ToIntArray3(string base64, int size)
{
List<int> res = new List<int>();
byte[] buffer = new byte[4];
using (var ms = new System.IO.MemoryStream(Convert.FromBase64String(base64)))
{
while(ms.Position < ms.Length)
{
ms.Read(buffer, 0, size);
res.Add(BitConverter.ToInt32(buffer, 0));
}
}
return res.ToArray();
}
我看不到以更快方式将字节填充到32位。任何想法,破坏和chapettes?解决方案应该在c#中。如果我必须,我可以沦为C / ++,但我不想这样做。
答案 0 :(得分:1)
没有理由使用内存流将字节从数组移动到另一个数组,只需直接从数组中读取。此外,数组的大小是已知的,因此需要将项添加到列表然后转换为数组,您可以从头开始使用数组:
static int[] Base64ToIntArray3(string base64, int size) {
byte[] data = Convert.FromBase64String(base64);
int cnt = data.Length / size;
int[] res = new int[cnt];
for (int i = 0; i < cnt; i++) {
switch (size) {
case 1: res[i] = data[i]; break;
case 2: res[i] = BitConverter.ToInt16(data, i * 2); break;
case 3: res[i] = data[i * 3] + data[i * 3 + 1] * 256 + data[i * 3 + 2] * 65536; break;
case 4: res[i] = BitConverter.ToInt32(data, i * 4); break;
}
}
return res;
}
注意:未经测试的代码!你必须验证它实际上做了它应该做的事情,但至少它显示了原理。
答案 1 :(得分:0)
这可能就是我的意思。不使用流应该可以提高性能。这似乎是使用Linq应该很容易做的事情,但我无法弄明白。
static int[] Base64ToIntArray3(string base64, int size)
{
if (size < 1 || size > 4) throw new ArgumentOutOfRangeException("size");
byte[] data = Convert.FromBase64String(base64);
List<int> res = new List<int>();
byte[] buffer = new byte[4];
for (int i = 0; i < data.Length; i += size )
{
Buffer.BlockCopy(data, i, buffer, 0, size);
res.Add(BitConverter.ToInt32(buffer, 0));
}
return res.ToArray();
}
答案 2 :(得分:0)
好的,所以我相信这是Linq的方法:
static int[] Base64ToIntArray3(string base64, int size)
{
byte[] data = Convert.FromBase64String(base64);
return data.Select((Value, Index) => new { Value, Index })
.GroupBy(p => p.Index / size)
.Select(g => BitConverter.ToInt32(g.Select(p => p.Value).Union(new byte[4 - size]).ToArray(), 0))
.ToArray();
}