解析PDF字体操作符缺失

时间:2016-02-18 15:52:12

标签: parsing pdf fonts cgpdf cgpdfscanner

我正在解析PDF文件,似乎缺少Tf操作符。我可以在PDF阅读器上看到,如<​​em> Acrobat reader 或 Preview ,字体会发生变化。但在解析过程中我没有Tf操作符。我仍然有ET运算符标记前一个文本块的结尾,BT操作符标记新操作符的开头。我还有文字显示运营商Tj&amp;合。

为了清楚起见,我确实有Tf操作员,但只是在一个地方它应该在那里,它不是。

PDF参考说明:

  

字体或大小都没有初始值;他们一定是   在显示任何文本之前使用Tf明确指定。

我不明白为什么如果我没有Tf操作符,这些读者如何正确呈现文本?

有人知道问题可能来自哪里吗?

1 个答案:

答案 0 :(得分:1)

AFAIK文本状态是图形状态的一部分,因此,如果您在某处有Q运算符,那么可以解释字体更改(它将恢复前一个q运算符保存的状态)。

此外,图形状态运算符gs可能会导致字体更改。