大型PDFsharp(MigraDoc)PdfDocument到byte []

时间:2017-08-03 11:51:36

标签: c# arrays pdf pdfsharp migradoc

我一直在尝试使用各种方法将大型PdfDocument保存到字节数组中,但总是返回到内存不足异常(文件为200 MB和2.5K页)。

我最初的尝试是简单地使用MemoryStream

public static byte[] ProcessLargePdfDocument(PdfDocument pdfDocument)
{
    using (MemoryStream stream = new MemoryStream())
    {
        pdfDocument.Save(stream, true);
        return stream.ToArray();
    }
}

然后我尝试添加一些缓冲

public static byte[] ProcessLargePdfDocument(PdfDocument pdfDocument, long whereToStartReading = 0)
{
    List<byte> byteList = new List<byte>();

    using (MemoryStream stream = new MemoryStream())
    {
        pdfDocument.Save(stream, false);
        byte[] buffer = new byte[megabyte];
        stream.Seek(whereToStartReading, SeekOrigin.Begin);
        int bytesRead = stream.Read(buffer, 0, megabyte);
        while (bytesRead > 0)
        {
            byteList.AddRange(buffer);
            bytesRead = stream.Read(buffer, 0, megabyte);
        }
    }

    return byteList.ToArray();
}

无论我尝试什么,我都会在pdfDocument.Save调用中获得内存不足异常。我能够将它写入文件位置并使用dev中的缓冲FileStream将其读回,但由于权限(但尚未),我无法在生产环境中执行此操作。

1 个答案:

答案 0 :(得分:1)

两个提示:

确保您的进程以64位进程运行,以允许它使用超过2 GiB的RAM。

stream.ToArray()创建副本,stream.GetBuffer()允许您访问MemoryStream的内部缓冲区。如果在Save()之后发生异常,这可能会产生影响。