PdfSharp.SharpZipLib.SharpZipBaseException - 标头校验和非法

时间:2016-10-14 00:20:46

标签: c# pdf pdfsharp

我真的卡住了,试图抓住没有密码保护的PDF的第一页(即Adobe Reader可以在没有提示的情况下打开它),我收到错误当我调用PdfReader.Open()

时返回
using (var pdfStream = new MemoryStream(_underlyingBytes))
{
    using (var allPages = PdfReader.Open(pdfStream, string.Empty, PdfDocumentOpenMode.ReadOnly))
    {
        if (allPages.PageCount < 1) throw new ArgumentException("PDF has no pages");

                using (var firstPage = new PdfDocument())
                {
                    firstPage.AddPage(allPages.Pages[0]);

                    using (var stream = new MemoryStream())
                    {
                        firstPage.Save(stream);
                        _underlyingBytes = stream.ToArray();

                        return this;
                    }
                }
     }
}

编辑

Here's the PDF I'm trying to open

如果有人想知道_underlyingBytes在哪里填充:

using (var stream = new MemoryStream())
{
    blob.DownloadToStream(stream);
    stream.Position = 0;
    _underlyingBytes = stream.ToArray();
}

1 个答案:

答案 0 :(得分:0)

好吧,我没有设法使用PDFSharp让这个工作,但我终于设法使用ITextSharp。他们揭露了一个静态属性&#34; unethicalreading&#34;它允许您打开受密码保护的PDF - 如果adobe reader可以在没有密码的情况下打开PDF的情况下仍然不是100%的原因...

无论如何,代码现在是:

using (var pdfStream = new MemoryStream(_underlyingBytes))
{
    PdfReader.unethicalreading = true;
    using (var reader = new PdfReader(pdfStream))
    {
        if (reader.NumberOfPages < 1) throw new ArgumentException("PDF has no pages");

        using (var document = new Document(reader.GetPageSizeWithRotation(1)))
        {
            using (var outputStream = new MemoryStream())
            {
                using (var pdfCopyProvider = new PdfCopy(document, outputStream))
                {
                    document.Open();

                    var importedPage = pdfCopyProvider.GetImportedPage(reader, 1);
                    pdfCopyProvider.AddPage(importedPage);

                    document.Close();
                    reader.Close();


                    _underlyingBytes = outputStream.ToArray();
                    return this;
                }
            }
        }
    }
}

这很好用,如果想要将第一页写入磁盘,可以很容易地用FileStream替换MemoryStream。

希望这有助于将来。