PDF文件的内部结构

时间:2016-02-25 13:27:14

标签: pdf

我正在研究PDF文件的结构。 如何从PDF文件中确定纸张大小,边距和字体大小等信息? 我知道F13适用于Helvetica,但其他字体怎么样?我甚至无法从Adobe doc中找到关于PDF的内容。

1 个答案:

答案 0 :(得分:5)

  

我正在研究PDF文件的结构。

请使用PDF规范ISO 32000-1

  

如何确定纸张尺寸等信息

每个页面都有自己的大小,它在页面字典中定义或继承:

  

MediaBox 矩形(必填;可继承)一个矩形(见7.9.5,“矩形”),   以默认用户空间单位表示,应定义   页面所在物理介质的边界   显示或打印(见14.11.2,“页面边界”)。

     

裁剪框矩形(可选;可继承)一个矩形,以默认用户空间表示   单位,应定义默认用户空间的可见区域。   显示或打印页面时,应剪切其内容   (裁剪)到这个矩形然后应施加在输出上   某种实现定义的方式的媒介(见14.11.2,   “页面边界”)。默认值: MediaBox。

的值      

(表30 - 页面对象中的条目)

  

余量

除非您的上述某些方框暗示了保证金,否则没有保证金。

  

和PDF文件中的字体大小?

字体用于绘制某些文本的大小在内容流中由 Tf 指令定义,并由当前转换矩阵和文本矩阵进行转换。

  

字体大小 Tf 将文本字体 T f 设置为 font 和文本字体大小 T fs ,到 size font 应该是   当前的 Font 子字典中的字体资源的名称   资源词典; size 应为表示比例因子的数字。    font size 没有初始值;他们应该被指定   在显示任何文本之前显式使用 Tf

     

(表105 - 文本状态运算符)

此外,

  

我知道F13适用于Helvetica,

可能有一个PDF页面就是这种情况,但下一个可能是 F2 Helv ASDFjklgfklöjsflaksfd,或者你想要的任何东西