使用PDFClown展平表单会抛出IndexOutOfBounds异常

时间:2015-08-11 21:15:57

标签: java pdfclown

我正在使用PDFClown-0.2.0来压缩this pdf文件。这是我的代码:

import org.pdfclown.documents.Document;
import org.pdfclown.files.File;
import org.pdfclown.files.SerializationModeEnum;
import org.pdfclown.tools.FormFlattener;

public class Sample {
    public static void main(String args[]){
        try {
            File f = new File("label.pdf");
            Document doc = f.getDocument();

            FormFlattener formFlattener = new FormFlattener();
            formFlattener.flatten(doc);
            f.save(SerializationModeEnum.Standard);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

我正在按照http://pdfclown.org/2014/09/12/waiting-for-pdf-clown-0-2-0-release/#FormFlattening提供的说明进行操作。但是,当我运行代码时,我收到以下错误:

java.lang.IndexOutOfBoundsException: Index: 1, Size: 1
    at java.util.ArrayList.rangeCheck(ArrayList.java:653)
    at java.util.ArrayList.get(ArrayList.java:429)
    at org.pdfclown.objects.PdfArray.get(PdfArray.java:314)
    at org.pdfclown.documents.interaction.forms.FieldWidgets.get(FieldWidgets.java:135)
    at org.pdfclown.documents.interaction.forms.FieldWidgets$1.next(FieldWidgets.java:380)
    at org.pdfclown.documents.interaction.forms.FieldWidgets$1.next(FieldWidgets.java:1)
    at org.pdfclown.tools.FormFlattener.flatten(FormFlattener.java:74)
    at com.narvar.webservices.returns.retailers.Sample.main(Sample.java:18)

我做错了什么?只是注意到pdf是使用PDFBox生成的,我已经将表单字段设为只读。

1 个答案:

答案 0 :(得分:2)

调试代码后,它看起来像一个PdfClown错误:

Iterator返回的org.pdfclown.documents.interaction.forms.FieldWidgets.iterator()无法识别下方的窗口小部件集合已更改(变得更小),因此尝试读取超出其大小的内容。

详细说明:

org.pdfclown.tools.FormFlattener.flatten(Document)遍历字段的小部件:

  for(Widget widget : field.getWidgets())

但在此循环中,它会从当前字段的 Kids 中删除当前窗口小部件:

    // Removing the field references relating the widget...
    PdfDictionary fieldPartDictionary = widget.getBaseDataObject();
    while (fieldPartDictionary != null)
    {
      [...]
      kidsArray.remove(fieldPartDictionary.getReference());
      [...]
    }

因此,外部for迭代的集合会发生变化。不幸的是,此处使用的Iterator不知道基本集合中的更改

return new Iterator<Widget>()
{
  /** Index of the next item. */
  private int index = 0;
  /** Collection size. */
  private final int size = size();

  @Override
  public boolean hasNext( )
  {return (index < size);}

  @Override
  public Widget next( )
  {
    if(!hasNext()) throw new NoSuchElementException();
    return get(index++);
  }

  @Override
  public void remove( )
  {throw new UnsupportedOperationException();}
};

正如你所看到的那样,它不仅既没有被通知也没有自己检查基本集合,它甚至对集合大小有自己的想法,这是Iterator生成集size集合的大小。 }。

这样的Iterator实现适用于可以通过体系结构或合同强制执行的非更改集合。但是在这种情况下,我看不到,架构显然允许集合发生变化,并且没有暗示所讨论的迭代器只能用于稳定的基础集合。

这应该是固定的。

解决方法

可以尝试通过更改FormFlattener.flatten来检索小部件的本地副本并迭代此副本,例如,通过替换

  for(Widget widget : field.getWidgets())

  List<Widget> widgets = new ArrayList<Widget>(field.getWidgets());
  for(Widget widget : widgets)