嗨,那些正在开发应用程序的人,主要工作是pdf编辑。
据我所知,Apple没有为编辑pdf提供任何api。但我的要求就是这样。
所以我想提取pdf文件的全部内容并在编辑后创建一个新的pdf。现在我需要知道如何提取PDF格式(页眉,页脚,图像,突出显示。,,)
我使用Tj运算符来提取pdf文本。我应该使用哪些操作员来提取pdf文件的其他信息。
提前感谢。
答案 0 :(得分:0)
使用Do运算符在页面上绘制图像。其操作数是资源字典中的图像名称。 Do运算符还绘制表单XObjects(自包含矢量图形),它们也存储在资源字典中。图像/表单XObject字典中的子类型键为您提供了对象类型:图像的“图像”和表单XObject的“表单”。
其他元素是纯矢量图形和文本,PDF文件没有页眉,页脚,段落等作为独立对象。您在视觉上看到的页面标题,在PDF文件中只是在页面顶部绘制的纯文本
亮点可以是普通的半透明黄色矩形(这些与页面上的其他矩形没有区别)或突出显示注释(这些在页面的Annots数组中可用)。