解析线性化的pdf外部参照表

时间:2015-05-11 09:03:52

标签: parsing pdf

我的pdf开头为:

%PDF-1.7
%‚„œ”

69 0 obj
<</Linearized 1/L 3937432/O 71/E 2811072/N 9/T 3935937/H [ 996 498]>>
endobj

xref
69 35
0000000016 00000 n

0000001494 00000 n

0000001593 00000 n

0000002065 00000 n

........................

最后我有:

0003929147 00000 n

0003929283 00000 n

0003929352 00000 n

0003929458 00000 n

0003935743 00000 n

trailer
<</Size 69/ID[<00E23EA222C14F40B1305A98D798C27F><F53AB532FC064AB39459DBD6BAF21DD6>]>>
startxref
11

现在,如果我尝试在11处获取startxref,那么我会得到“œ”字符串......这看起来不对,我怎么去实际的xrefstart(“xref”), 任何身体可以帮助吗?

1 个答案:

答案 0 :(得分:0)

您的xref表字节偏移量是错误的。它不是11。

startxref
11

如果您已修复此问题,则可以正确访问xref