我有一个庞大的数据集,我想写入Excel,并且需要根据业务逻辑对行进行条件格式设置。因此,对于数据插入部分,我正在使用数据数组填充Excel,并且工作速度非常快。但是,在格式化行时,我发现性能严重下降。进行格式化几乎要花费两倍多的时间。
截至目前,我正在将格式化应用于单个行并遍历一系列行。但是,我想知道是否可以一次选择多行并将批量格式化选项应用于这些行: 这是我现在所拥有的:
foreach (int row in rowsToBeFormatted)
{
Excel.Range range = (Excel.Range)xlsWorksheet.Range[xlsWorksheet.Cells[row + introFormat, 1], xlsWorksheet.Cells[row + introFormat, 27]];
range.Font.Size = 11;
range.Interior.ColorIndex = 15;
range.Font.Bold = true;
}
这是演示如何尝试选择范围中的多行并应用格式的演示:
string excelrange = "A3:AA3,A83:AA83,A88:AA88,A94:AA94,A102:AA102,A106:AA106,A110:AA110,...." (string with more than 3000 characters)
xlsWorksheet.get_Range(excelrange).Interior.Color = Color.SteelBlue;
但是,执行代码时出现以下错误:
HRESULT异常:0x800A03EC
,内部异常没有任何内容。有什么想法可以达到预期的效果吗?
答案 0 :(得分:1)
根据问题下的注释,范围字符串的硬编码限制为255个字符,但是我找不到任何有关它的文档。另一位评论者建议使用分号作为分隔符,但the documentation明确指出,逗号应作为范围字符串中的联合运算符:
以应用程序语言的 A1样式表示形式的范围名称。它可以包括范围运算符(冒号),相交运算符(空格)或联合运算符(逗号)。它还可以包含美元符号,但它们会被忽略。您可以在范围的任何部分使用本地定义的名称。如果使用名称,则假定该名称使用应用程序的语言。
那我们从这里去哪里呢?单独格式化每个范围确实效率不高。 Application
接口提供了方法Union
,但在循环中调用它的效率与单独格式化一样低。因此,自然的选择是最大使用范围字符串限制,从而最大程度地减少对COM接口的调用次数。
您可以将整个范围分割为多个格式;每个不超过255个字符的限制。我将使用枚举器实现它:
static IEnumerable<string> GetChunks(IEnumerable<string> ranges)
{
const int MaxChunkLength = 255;
var sb = new StringBuilder(MaxChunkLength);
foreach (var range in ranges)
{
if (sb.Length > 0)
{
if (sb.Length + range.Length + 1 > MaxChunkLength)
{
yield return sb.ToString();
sb.Clear();
}
else
{
sb.Append(",");
}
}
sb.Append(range);
}
if (sb.Length > 0)
{
yield return sb.ToString();
}
}
var rowsToFormat = new[] { 3, 83, 88, 94, 102, 106, 110/*, ...*/ }
var rowRanges = rowsToFormat.Select(row => "A" + row + ":" + "AA" + row);
foreach (var chunk in GetChunks(rowRanges))
{
var range = xlsWorksheet.Range[chunk];
// do formatting stuff here
}
上述内容比单个格式快10-15倍:
foreach (var rangeStr in rowRanges)
{
var range = xlsWorksheet.Range[rangeStr];
// do formatting stuff here
}
我还可以看到更多的优化空间,例如对连续的行进行分组,但是如果您要格式化具有小计的离散行,那将无济于事。