PDFClown复制注释然后操纵它们

时间:2018-04-29 19:06:10

标签: pdfclown

我需要将注释从一个PDF文件复制到另一个PDF文件。我使用了优秀的PDFClown库但无法操纵颜色,旋转等等。这可能吗?我可以看到基础对象信息,但也不确定如何直接操作它。

我可以通过克隆外观复制外观但不能“编辑”它。

提前致谢。 亚历

如果作者斯蒂芬诺正在倾听,项目是否已经死亡?

2 个答案:

答案 0 :(得分:0)

一般注释和特别是Callout注释

我稍微调查了一下,我担心没有太多可以使用高级方法确定性地操纵任意输入。原因是有很多替代方法来设置Call​​out注释的外观,而PDF Clown只支持使用显式高级方法的优先级较低的方法。从高优先级向下

  • AP 流中的显式外观。如果给出它,则使用它,忽略此外观是否看起来像Callout注释,更不用说像其他Callout属性定义的那样。

    PDF Clown不会为其他值的标注注释创建外观,更不用说更新现有外观以跟进某些特定属性(例如Color)更改。对于ISO 32000-2支持,此处的PDF Clown必须进行改进,因为外观流已成为强制性的。

    如果它存在,您可以使用getAppearance()检索外观,但只有FormXObject的低级绘图说明,没有特定的标注。

    根据FormXObject,您可以很容易地操作,但是,通过相应地设置矩阵,您可以非常轻松地旋转或倾斜外观,例如。

    annotation.getAppearance().getNormal().get(null).setMatrix(AffineTransform.getRotateInstance(100, 10));
    
  • RC 字符串或流中的富文本字符串。除非给出外观,否则Callout文本框中的文本是从此富文本数据生成的(此处的富文本使用XHTML 1.0子集进行格式化)。

    PDF Clown尚未创建Callout文本的富文本表示,更不用说更新现有的文本以跟进某些特定属性(例如Color)更改..

    如果存在,您可以使用getBaseDataObject().get(PdfName.RC)通过低级别访问检索富文本,更改此字符串或流,然后使用getBaseDataObject().put(PdfName.RC, ...)重新设置它。同样,您可以使用其名称PdfName.DS来检索,操作和设置富文本默认样式字符串。

  • 在没有外观流和(就文本内容而言)富文本字符串的情况下,用于构建Callout的各个方面的许多不同设置。

    PDF Clown支持(许多)这些属性,特别是如果您将克隆的注释转换为StaticNote,例如不透明度 CA 使用get/set/withAlpha,边框边框 / BS 使用get/set/withBorder,背景颜色 C 使用get/set/withColor,...

    顺便说一下,它的行结束样式有错误 LE 支持:显然已复制注释 LE 属性的代码没有检查;不幸的是,那个属性遵循不同的语法......

您的任务

关于您声明要更改的属性,

  • 旋转:Callout注释本身没有旋转属性(除了标记是否跟随页面旋转)。因此,您不能将旋转设置为简单的注释属性。但是,如果源注释确实具有外观流,则可以操纵其矩阵以在注释矩形内旋转它,参见上文。

  • 边框颜色字体:如果您的标注有外观流,您可以尝试使用ContentScanner解析其内容并操纵颜色和字体设置操作。否则,如果设置了富文本信息,则可以尝试使用某些XML解析器解析富文本并操纵字体样式属性。否则,您可以解析默认外观 DA 字符串并操纵其字体和颜色设置说明。

一些示例代码

我使用Adobe Acrobat创建了一个带有示例标注注释的文件:Callout-Yellow.pdf。它包含外观流,富文本和简单属性,因此可以使用此文件进行不同级别的操作。

我将此代码应用于keepAppearanceStreamkeepRichText的不同值(您没有提及是否使用了PDF Clown for Java或.Net;所以我选择了Java;一个端口到.Net应该是微不足道的,但是......):

boolean keepAppearanceStream = ...;
boolean keepRichText = ...;

try (   InputStream sourceResource = GET_STREAM_FOR("Callout-Yellow.pdf");
        InputStream targetResource = GET_STREAM_FOR("test123.pdf");
        org.pdfclown.files.File sourceFile = new org.pdfclown.files.File(sourceResource);
        org.pdfclown.files.File targetFile = new org.pdfclown.files.File(targetResource); ) {
    Document sourceDoc = sourceFile.getDocument();
    Page sourcePage = sourceDoc.getPages().get(0);
    Annotation<?> sourceAnnotation = sourcePage.getAnnotations().get(0);

    Document targetDoc = targetFile.getDocument();
    Page targetPage = targetDoc.getPages().get(0);

    StaticNote targetAnnotation = (StaticNote) sourceAnnotation.clone(targetDoc);

    if (keepAppearanceStream) {
        // changing properties of an appearance
        // rotating the appearance in the appearance rectangle
        targetAnnotation.getAppearance().getNormal().get(null).setMatrix(AffineTransform.getRotateInstance(100, 10));
    } else {
        // removing the appearance to allow lower level properties changes
        targetAnnotation.setAppearance(null);
    }

    // changing text background color
    targetAnnotation.setColor(new DeviceRGBColor(0, 0, 1));

    if (keepRichText) {
        // changing rich text properties
        PdfString richText = (PdfString) targetAnnotation.getBaseDataObject().get(PdfName.RC);
        String richTextString = richText.getStringValue();
        // replacing the font family
        richTextString = richTextString.replaceAll("font-family:Helvetica", "font-family:Courier");
        richText = new PdfString(richTextString);
        targetAnnotation.getBaseDataObject().put(PdfName.RC, richText);
    } else {
        targetAnnotation.getBaseDataObject().remove(PdfName.RC);
        targetAnnotation.getBaseDataObject().remove(PdfName.DS);
    }

    // changing default appearance properties
    PdfString defaultAppearance = (PdfString) targetAnnotation.getBaseDataObject().get(PdfName.DA);
    String defaultAppearanceString = defaultAppearance.getStringValue();
    // replacing the font
    defaultAppearanceString = defaultAppearanceString.replaceFirst("Helv", "HeBo");
    // replacing the text and line color
    defaultAppearanceString = defaultAppearanceString.replaceFirst(". . . rg", ".5 g");
    defaultAppearance = new PdfString(defaultAppearanceString);
    targetAnnotation.getBaseDataObject().put(PdfName.DA, defaultAppearance);

    // changing the text value
    PdfString contents = (PdfString) targetAnnotation.getBaseDataObject().get(PdfName.Contents);
    String contentsString = contents.getStringValue();
    contentsString = contentsString.replaceFirst("text", "text line");
    contents = new PdfString(contentsString);
    targetAnnotation.getBaseDataObject().put(PdfName.Contents, contents);

    // change the line width and style
    targetAnnotation.setBorder(new Border(0, new LineDash(new double[] {3, 2})));

    targetPage.getAnnotations().add(targetAnnotation);

    targetFile.save(new File(RESULT_FOLDER, "test123-withCalloutCopy.pdf"),  SerializationModeEnum.Standard);
}

CopyCallOut test testCopyCallout

请注意,代码只具有概念验证质量:对于任意PDF,您不能简单地期望字符串替换“font-family:Helvetica”由“font-family:Courier”或“Helv”替换为“HeBo”或“。rg”由“.5 g”完成工作:可以使用不同的样式属性或名称给出字体,并且可以使用不同的着色说明。

Adob​​e中的屏幕截图

  • 原始文件:

    Original annotation

  • keepAppearanceStream = true

    with appearance stream kept but rotated

  • keepAppearanceStream = falsekeepRichText = true

    with appearance stream dropped and rich text kept but manipulated

  • keepAppearanceStream = falsekeepRichText = false

    with appearance stream and rich text dropped and simple attributes manipulated

答案 1 :(得分:0)

作为帖子提交Mkl 在创建新注释时,您的好建议非常有用。我确实将以下内容用作&#34;复制&#34;一个现有的注释,其中注释是&#34;克隆&#34;注释广告baseAnnotation源

 foreach (PdfName t in baseAnnotation.BaseDataObject.Keys)
  {
                if (t.Equals(PdfName.DA) || t.Equals(PdfName.DS) || t.Equals(PdfName.RC) || t.Equals(PdfName.Rotate))
                {
                    note.BaseDataObject[t] = baseAnnotation.BaseDataObject[t];
                }
            }

再次感谢