具有内存不足异常的EPPlus大数据集问题

时间:2014-11-06 19:05:54

标签: c# excel excel-2007 epplus

系统内存异常。我看到内存Stream只在保存时刷新。我们有1.5 - 2GB的数据集。

我正在使用EPPlus版本3.1.3.0

我们在代码中执行以下操作。

我们循环

     --> Create a Package
        --> each table in the datareader
            -->   Add WorkSheet to the Package 
        --> Dispose Each table.
     --> Save the  Package.

每个数据表的大小为300Mg,最多15个表格来自系统。

这导致了一个问题,我已经详细记录了这个@ https://epplus.codeplex.com/workitem/15085

我仍然希望能够使用EPPlus非常好的API。但是,一旦我们将工作表添加到包中,就有更好的方法来释放工作表。

感谢您的帮助。

5 个答案:

答案 0 :(得分:10)

我遇到了这个问题,但我通过将“Platform target”选项从x86切换为x64或“Any CPU”来修复此问题。 (右键单击项目,然后选择“属性”,然后选择“构建”选项卡,然后在“平台目标”上选择“x64”)

问题是对于平台x86,您只能使用大约1.8 GB的RAM。对于平台x64,您没有此限制。

答案 1 :(得分:9)

不幸的是,这似乎是EPPlus的一个主要限制 - 您可以在其codeplex页面上找到其他人发布的内容。我在导出大型数据集时遇到了类似的问题 - 单个表格宽115+列,高60K +行。通常,当内存不足时,大约30到35k行。发生了什么是创建的每个单元格都是它自己的对象,对于小数据集来说很好,但在我的情况下它将是115x60K = ~700万。由于每个单元格都是一个包含内容(主要是字符串)的对象,因此其内存占用量会快速增加。

在未来的某个时刻,我的计划是使用Linq2Xml手动创建XML文件。 xlsx只是一个用XML文件重命名的zip文件,它构成了工作簿和工作表的内容。因此,你可以使用EPP创建一个空的xlsx,保存它,打开它作为zip,拉出sheet1.xml并通过字符串操作添加数据内容。您还必须处理Excel用于帮助保持文件大小的sharedstring.xml文件。可能还有其他xml文件需要更新以及密钥或名称。

如果您将任何xlx重命名为.zip扩展名,则可以看到此内容。

示例sheet1.xml:

Simple Excel File Example

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<worksheet xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" mc:Ignorable="x14ac" xmlns:x14ac="http://schemas.microsoft.com/office/spreadsheetml/2009/9/ac">
    <dimension ref="A1:C2"/>
    <sheetViews>
        <sheetView tabSelected="1" workbookViewId="0">
            <selection activeCell="C5" sqref="C5"/>
        </sheetView>
    </sheetViews>
    <sheetFormatPr defaultRowHeight="15" x14ac:dyDescent="0.25"/>
    <sheetData>
        <row r="1" spans="1:3" x14ac:dyDescent="0.25">
            <c r="A1" t="s">
                <v>0</v>
            </c><c r="B1" t="s">
                <v>1</v>
            </c><c r="C1" t="s">
                <v>0</v>
            </c>
        </row>
        <row r="2" spans="1:3" x14ac:dyDescent="0.25">
            <c r="A2" t="s">
                <v>1</v>
            </c><c r="B2" t="s">
                <v>0</v>
            </c><c r="C2" t="s">
                <v>1</v>
            </c>
        </row>
    </sheetData>
    <pageMargins left="0.7" right="0.7" top="0.75" bottom="0.75" header="0.3" footer="0.3"/>
</worksheet>

示例sharedstrings.xml:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<sst xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main" count="6" uniqueCount="2">
    <si>
        <t>AA</t>
    </si>
    <si>
        <t>BB</t>
    </si>
</sst>

您可以在我的其他帖子中看到我是如何进行xml操作的:

Create Pivot Table Filters With EPPLUS

抱歉,我无法给你一个更好的答案,但希望这会有所帮助。

答案 2 :(得分:0)

@Ernie对于当前EPPlus版本的一些限制是正确的。他们已经承认这一点,并一直在努力修复它。这为您提供了两种可能的选项之一:

1)切换到EPPlus 4.0 Beta,他们已经解决了这个问题以及其他一些问题(尽管你将使用测试版)。

2)ExcelPackageExcelWorksheet类都实现IDisposable,因此如果要在using()语句中包含它们的使用情况,可能会开始获得更好的性能

答案 3 :(得分:0)

如果要将流传递给ExcelPackage,请注意。在我的情况下,我有一个Windows服务,使用内存流加载包。现在,服务在一些OutOfMemory异常后崩溃了。

原因:处理ExcelPackage不会丢弃流!

解决方案:

using (MemoryStream ms = new MemoryStream(Convert.FromBase64String(excelSheetBase64)))
using (ExcelPackage excelPackage = new ExcelPackage(ms))
{
    // Your code
}

答案 4 :(得分:0)

在调试大量数据时有时会出现问题。

如果您以真实的IIS在服务器中尝试该应用程序 或如果您使用Win PRO

,则在tru IIS中的PC中

OutOFMemoryException上的问题不会发生。