如何使用ADO.Net最好地插入350,000行

时间:2009-04-05 04:50:30

标签: c# .net ado.net csv etl

我有一个包含350,000行的csv文件,每行有大约150列。

使用ADO.Net将这些行插入SQL Server的最佳方法是什么?

我通常这样做的方法是手动创建SQL语句。我想知道是否有任何方法可以将其编码为简单地将整个数据表插入SQL Server?或者像这样的捷径。

顺便说一下,我已经尝试过使用SSIS,但是我可以使用C#处理一些数据清理问题,但SSIS并不那么容易。数据以XML格式开头,但为了简单起见,我将其更改为CSV格式。

3 个答案:

答案 0 :(得分:7)

创建一个实现IDataReader的类“CsvDataReader”。只需实现Read(),GetValue(int i),Dispose()和构造函数:如果需要,可以让其余的抛出NotImplementedException,因为SqlBulkCopy不会调用它们。使用read来处理每行的读取,使用GetValue读取行中的第i个值。

然后将其传递给SqlBulkCopy,并使用您想要的相应列映射。

我使用该方法获得大约30000条记录/秒插入速度。

如果您可以控制源文件格式,请将其设置为分隔符,因为它比CSV更容易解析。

修改:http://www.codeproject.com/KB/database/CsvReader.aspx - tx Mark Gravell。

答案 1 :(得分:2)

SqlBulkCopy如果可用的话。以下是使用SqlBulkCopy in ADO.NET 2.0 with C#

的非常有用的说明

我认为您可以将XML直接加载到DataSet中,然后将SqlBulkCopy映射到数据库和DataSet。

答案 2 :(得分:1)

嘿,你应该恢复到XML而不是csv,然后使用openxml将该xml文件加载到临时表中,清理临时表中的数据,然后最终处理这些数据。

我一直在使用这种方法进行大量数据导入,其中我的XML文件恰好是> 500 mb的尺寸和openxml就像一个魅力。

与手动ado.net语句相比,你会感到惊讶的是它会有多快。