我有这个c#程序,我可以将数据导出到excel文件。它调用sql server中的存储过程并将结果返回给excel文件(基于我选择的过滤器)。
现在,我能够成功导出它,但如果我尝试从2000万条记录表中提取更多数据(20,000条左右的记录),那么它会占用太长时间。我在代码中添加了一个秒表,发现foreach循环是罪魁祸首。
这是我的代码:
private void ExportExcel(SqlDataReader dr)
{
try
{
DataTable dt = new DataTable();
dt.Load(dr);
SaveFileDialog saveFileDialog1 = new SaveFileDialog();
saveFileDialog1.Filter = "Microsoft Office Excel Workbook (*.xls)|*.xls|All Files (*.*)|*.*";
saveFileDialog1.FilterIndex = 1;
saveFileDialog1.RestoreDirectory = true;
if (saveFileDialog1.ShowDialog() == DialogResult.OK)
{
// Create an Excel object and add workbook...
Excel.ApplicationClass excel = new Excel.ApplicationClass();
Excel.Workbook workbook = excel.Application.Workbooks.Add(true); // true for object template???
// var watch = System.Diagnostics.Stopwatch.StartNew();
// Add column headings...
int iCol = 0;
int iVisibleColumnCount = 0;
foreach (DataColumn c in dt.Columns)
{
iCol++;
// counting visible columns
if (c.ColumnMapping != MappingType.Hidden)
iVisibleColumnCount++;
else // hide the columns in excel if the column is hide in datatable
{
((Excel.Range)excel.Cells[1, iCol]).EntireColumn.Hidden = true;
continue;
}
// Set column header text to bold
((Excel.Range)excel.Cells[1, iCol]).Font.Bold = true;
excel.Cells[1, iCol] = c.ColumnName;
if (c.DataType == typeof(System.String))
((Excel.Range)excel.Cells[1, iCol]).EntireColumn.NumberFormat = "@";
else if (c.DataType == typeof(System.Int16)
|| c.DataType == typeof(System.Int32)
|| c.DataType == typeof(System.Int64))
((Excel.Range)excel.Cells[1, iCol]).EntireColumn.NumberFormat = "#,##0";
else if (c.DataType == typeof(System.TimeSpan))
((Excel.Range)excel.Cells[1, iCol]).EntireColumn.NumberFormat = @"[$-409]hh:mm:ss AM/PM;@";
else if (c.DataType == typeof(System.DateTime))
((Excel.Range)excel.Cells[1, iCol]).EntireColumn.NumberFormat = "yyyy-mm-dd hh:mm:ss";
else if (c.DataType == typeof(System.Decimal))
((Excel.Range)excel.Cells[1, iCol]).EntireColumn.NumberFormat = @"#,##0.00_);[Red](#,##0.00)";
else
((Excel.Range)excel.Cells[1, iCol]).EntireColumn.NumberFormat = "General";
}
// for each row of data...
int iRow = 0;
foreach (DataRow r in dt.Rows)
{
iRow++;
// add each row's cell data...
iCol = 0;
foreach (DataColumn c in dt.Columns)
{
iCol++;
if (c.ColumnMapping != MappingType.Hidden)
{
if (c.DataType == typeof(DateTime))
{
DateTime date1 = (DateTime)r[c.ColumnName];
string DateTime = date1.ToString();
if (DateTime.Contains("AM"))
{
excel.Cells[iRow + 1, iCol] = date1.ToString("yyyy-MM-dd hh:mm:ss") + " AM";
}
else {
excel.Cells[iRow + 1, iCol] = date1.ToString("yyyy-MM-dd hh:mm:ss") + " PM";
}
}
else {
excel.Cells[iRow + 1, iCol] = r[c.ColumnName].ToString();
}
}
}
}
有人可以就如何提高导出到excel所需的性能提出一些建议吗?
答案 0 :(得分:3)
如何通过COM互操作访问Excel?
如果是这样,您将要避免单独设置每个单元格的值,因为这确实非常慢。尝试将数组分配给尽可能大的范围。
例如,由于您似乎无条件地遍历每一行,看起来您至少可以尝试构建一个表示一列的数组/向量,并将其分配到该列中的适当范围。
答案 1 :(得分:1)
没有明显的方法来改善这一点。如果循环花费时间(而不是sql过程),那么大部分工作必须由excel库完成。你可以查看excel的不同库,如果你很幸运,可能允许并行构建行,或者只是更快。否则,您只能在循环内对自己的代码进行小优化。你可能会稍微改进那个日期时间码,但如果它会产生很大的不同,我会感到惊讶。
你需要excel表还是csv(可以用excel打开)呢?如果csv可以工作,那么可以直接从sql导出或者自己并行构建行而不依赖于库。