我有一个用小端编码的二进制文件,包含大约250,000个var1的值,然后是另一个相同数量的var2值。我应该创建一个读取文件的方法,并在列var1和var2中返回带有这些值的DataSet。
我在SO中多次使用图书馆:miscutil,有关详细信息,请参阅此处:will there be an update on MiscUtil for .Net 4?
非常感谢Jon Skeet让它可用。 :)
我有以下代码工作,我对如何最小化从文件读取的for循环和填充DataTable的更好的想法感兴趣。有什么建议吗?
private static DataSet parseBinaryFile(string filePath)
{
var result = new DataSet();
var table = result.Tables.Add("Data");
table.Columns.Add("Index", typeof(int));
table.Columns.Add("rain", typeof(float));
table.Columns.Add("gnum", typeof(float));
const int samplesCount = 259200; // 720 * 360
float[] vRain = new float[samplesCount];
float[] vStations = new float[samplesCount];
try
{
if (string.IsNullOrWhiteSpace(filePath) || !File.Exists(filePath))
{
throw new ArgumentException(string.Format("Unable to open the file: '{0}'", filePath));
}
// at this point FilePath is valid and exists...
using (FileStream fs = new FileStream(filePath, FileMode.Open))
{
// We are using the library found here: http://www.yoda.arachsys.com/csharp/miscutil/
var reader = new MiscUtil.IO.EndianBinaryReader(MiscUtil.Conversion.LittleEndianBitConverter.Little, fs);
int i = 0;
while (reader.BaseStream.Position < reader.BaseStream.Length) //while (pos < length)
{
// Read Data
float buffer = reader.ReadSingle();
if (i < samplesCount)
{
vRain[i] = buffer;
}
else
{
vStations[i-samplesCount] = buffer;
}
++i;
}
Console.WriteLine("number of reads was: {0}", (i/2).ToString("N0"));
}
for (int j = 0; j < samplesCount; ++j)
{
table.Rows.Add(new object[] { j + 1, vRain[j], vStations[j] });
}
}
catch (Exception exc)
{
Debug.WriteLine(exc.Message);
}
return result;
}
答案 0 :(得分:1)
选项#1
将整个文件读入内存(或内存映射)并循环一次。
选项#2
在读取带有var2占位符值的var1部分时添加所有数据表行。然后在读取var2部分时修复数据表。