我正在使用PDFBox,成功从PDF中检索字段坐标。转到多页PDF,遇到了我需要确定这些字段来自哪个页面的情况,另外还要将坐标从自下而上转换为自上而下。我已阅读文档的许多页面,以找到一个可行的方法,大多数返回null或失败,并且搜索时没有结果。
我在找什么?文件大纲? BBbos?媒体框?裁剪框?
对于页码,其他一些库有像getCurrentPageNo()这样简单的标题方法。我需要:
List allPages = document.getDocumentCatalog().getAllPages();
for (int i = 0; i < allPages.size(); i++) {
// etc for each one?
}
这是一个核心能力,我有点惊讶我还没有找到一个例子。
答案 0 :(得分:1)
知道了:
PDPage page = .........
PDRectangle mediaBox = page.getMediaBox();
System.out.println( "Width:" + mediaBox.getWidth() );
System.out.println( "Height:" + mediaBox.getHeight() )
页码:
page.getCOSDictionary().equals(page))