如何将注释/突出显示从一个PDF复制到该PDF的更新版本?

时间:2011-09-03 17:04:59

标签: pdf

我最近几乎专注于电子书。我喜欢在阅读时用突出显示或注释标记文档。

然而,当我获得PDF的更新版本时 - 例如,O'Reilly将会访问您购买的书籍的更正版本 - 然后我会使用标记较旧的副本和较新版本复制,没有我的笔记。

我的首选语言是C#我意识到iTextSharp可能是我需要使用的,如果我想以编程方式执行此操作(请参阅示例Copy pdf annotations via C#),但有更简单的方法处理这个?

我无法相信我是唯一一个有这个问题的人,那么是否已经有一个解决方案可以为我处理这个问题?

1 个答案:

答案 0 :(得分:0)

您可以将此示例用于iTextSharp来解决您的问题:

var output = new MemoryStream();

using (var document = new Document(PageSize.A4, 70f, 70f, 20f, 20f))
{
    var readers = new List<PdfReader>();
    var writer = PdfWriter.GetInstance(document, output);

    writer.CloseStream = false;

    document.Open();

    const Int32 requiredWidth = 500;
    const Int32 zeroBottom = 647;
    const Int32 left = 50;

    Action<String, Action> inlcudePdfInDocument = (filename, e) =>
    {
         var reader = new PdfReader(filename);
         readers.Add(reader);

         var pageCount = reader.NumberOfPages;
         for (var i = 0; i < pageCount; i++)
         { 
             e?.Invoke();
             var imp = writer.GetImportedPage(reader, (i + 1));

             var scale = requiredWidth / imp.Width;
             var height = imp.Height * scale;

             writer.DirectContent.AddTemplate(imp, scale, 0, 0, scale, left, zeroBottom - height);

             var annots = reader.GetPageN(i + 1).GetAsArray(PdfName.ANNOTS);
             if (annots != null && annots.Size != 0)
             {
                 foreach (var a in annots)
                 {
                     var newannot = new PdfAnnotation(writer, new Rectangle(0, 0));
                     var annotObj = (PdfDictionary) PdfReader.GetPdfObject(a);
                     newannot.PutAll(annotObj);
                     var rect = newannot.GetAsArray(PdfName.RECT);
                     rect[0] = new PdfNumber(((PdfNumber)rect[0]).DoubleValue * scale + left); // Left
                     rect[1] = new PdfNumber(((PdfNumber)rect[1]).DoubleValue * scale); // top
                     rect[2] = new PdfNumber(((PdfNumber)rect[2]).DoubleValue * scale + left); // right
                     rect[3] = new PdfNumber(((PdfNumber)rect[3]).DoubleValue * scale); // bottom
                     writer.AddAnnotation(newannot);
                 }
             }

             document.NewPage();
         }

     }

    foreach (var apprPdf in pdfs)
    {
        document.NewPage();

        inlcudePdfInDocument(apprPdf.Pdf, null);
    }

    document.Close();
    readers.ForEach(x => x.Close());
}

output.Position = 0;
return output;

此示例将带注释的pdf文件列表复制到新的pdf文件中。

同时从两个PdfReader获取数据 - 一个用于复制新的pdf,另一个用于复制旧pdf的注释。