在C#中的Excel中格式化多行的最快方法

时间:2019-07-16 13:54:03

标签: c# .net excel office-interop

我有一个庞大的数据集,我想写入Excel,并且需要根据业务逻辑对行进行条件格式设置。因此,对于数据插入部分,我正在使用数据数组填充Excel,并且工作速度非常快。但是,在格式化行时,我发现性能严重下降。进行格式化几乎要花费两倍多的时间。

截至目前,我正在将格式化应用于单个行并遍历一系列行。但是,我想知道是否可以一次选择多行并将批量格式化选项应用于这些行: 这是我现在所拥有的:

foreach (int row in rowsToBeFormatted)
{
    Excel.Range range = (Excel.Range)xlsWorksheet.Range[xlsWorksheet.Cells[row + introFormat, 1], xlsWorksheet.Cells[row + introFormat, 27]];
    range.Font.Size = 11;
    range.Interior.ColorIndex = 15;
    range.Font.Bold = true;
}

这是演示如何尝试选择范围中的多行并应用格式的演示:

string excelrange = "A3:AA3,A83:AA83,A88:AA88,A94:AA94,A102:AA102,A106:AA106,A110:AA110,...." (string with more than 3000 characters)
xlsWorksheet.get_Range(excelrange).Interior.Color = Color.SteelBlue;

但是,执行代码时出现以下错误:

  

HRESULT异常:0x800A03EC

,内部异常没有任何内容。有什么想法可以达到预期的效果吗?

1 个答案:

答案 0 :(得分:1)

根据问题下的注释,范围字符串的硬编码限制为255个字符,但是我找不到任何有关它的文档。另一位评论者建议使用分号作为分隔符,但the documentation明确指出,逗号应作为范围字符串中的联合运算符:

  

以应用程序语言的 A1样式表示形式的范围名称。它可以包括范围运算符(冒号),相交运算符(空格)或联合运算符(逗号)。它还可以包含美元符号,但它们会被忽略。您可以在范围的任何部分使用本地定义的名称。如果使用名称,则假定该名称使用应用程序的语言。

那我们从这里去哪里呢?单独格式化每个范围确实效率不高。 Application接口提供了方法Union,但在循环中调用它的效率与单独格式化一样低。因此,自然的选择是最大使用范围字符串限制,从而最大程度地减少对COM接口的调用次数。

您可以将整个范围分割为多个格式;每个不超过255个字符的限制。我将使用枚举器实现它:

static IEnumerable<string> GetChunks(IEnumerable<string> ranges)
{
    const int MaxChunkLength = 255;
    var sb = new StringBuilder(MaxChunkLength);
    foreach (var range in ranges)
    {
        if (sb.Length > 0)
        {
            if (sb.Length + range.Length + 1 > MaxChunkLength)
            {
                yield return sb.ToString();
                sb.Clear();
            }
            else
            {
                sb.Append(",");
            }
        }
        sb.Append(range);
    }
    if (sb.Length > 0)
    {
        yield return sb.ToString();
    }
}

var rowsToFormat = new[] { 3, 83, 88, 94, 102, 106, 110/*, ...*/ }
var rowRanges = rowsToFormat.Select(row => "A" + row + ":" + "AA" + row);

foreach (var chunk in GetChunks(rowRanges))
{
    var range = xlsWorksheet.Range[chunk];
    // do formatting stuff here
}

上述内容比单个格式快10-15倍:

foreach (var rangeStr in rowRanges)
{
    var range = xlsWorksheet.Range[rangeStr];
    // do formatting stuff here
}

我还可以看到更多的优化空间,例如对连续的行进行分组,但是如果您要格式化具有小计的离散行,那将无济于事。