我正在使用以下代码从MS SQL Server表中加载数据:
using (SqlDataReader rdr = cmd.ExecuteReader())
{
if (rdr.HasRows)
{
dt.Load(rdr); //takes forever to load
}
if (dt.Rows.Count > 0 && !dt.HasErrors)
{
Parallel.For (0, dt.Rows.Count, i =>
{
byte[] docBytes = (byte[])(dt.Rows[i]["DocObject"]); File.WriteAllBytes(Path.Combine(Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "Documents\\"), $"{dt.Rows[i]["FileName"].ToString().ToLower()}"), docBytes);
});
}
}
}
SQL查询的执行时间不到一秒钟。数据包含一个SQL图像列,其中包含二进制文档数据。我使用System.Diagnostics的Stopwatch来计时执行时间,发现该dt.Load(rdr)语句大约需要5分钟来加载大约5,000条记录。我的应用程序需要加载几百万行,以这种速度,该应用程序将无法使用。这是使用标准Windows窗体构建的Windows窗体应用程序。任何想法为什么dt.Load(rdr)永远需要?任何关于重写此代码或提高其性能的想法将不胜感激。
答案 0 :(得分:6)
尝试类似这样的方法,而不是将所有行都加载到客户端的内存中:
using (SqlDataReader rdr = cmd.ExecuteReader(CommandBehavior.SequentialAccess))
{
while (rdr.Read())
{
string fn = rdr.GetString(0);
using (var rs = rdr.GetStream(1))
{
var fileName = $"c:\\temp\\{fn}.txt";
using (var fs = File.OpenWrite(fileName))
{
rs.CopyTo(fs);
}
Console.WriteLine(fileName);
}
}
}
答案 1 :(得分:0)
下面的代码未经测试。这只是一个主意。
另一种方法是定义实体类,并用SqldataReader
填充列表。完全不要使用DataTable
。
另外,应该尽快关闭数据库连接。因此,在获取数据时不要做其他工作。
希望您在连接字符串中使用connection pool
public class Example
{
public byte DocObject {get;set;}
public string FileName {get;set;}
}
List<Example> objList=new List<Example>();
using (SqlDataReader rdr = cmd.ExecuteReader())
{
while (rdr.Read())
{
Example obj=new Example();
obj.DocObject=(byte[])rdr["DocObject"] //suitable cast
obj.FileName =rdr["FileName "].toSting() //suitable cast
objList.Add(obj);
}
}
}
if (objList.Count > 0)
{
Parallel.For (0, objList.Count, i =>
{
byte[] docBytes = (byte[])(objList[i]["DocObject"]); File.WriteAllBytes(Path.Combine(Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "Documents\\"), $"{objList[i]["FileName"].ToString().ToLower()}"), docBytes);
});
}
}