我一直在查看PDF文件以了解它是如何构建的。
我注意到InDesign创建的PDF文本如下(使用pdftk解压缩后)。
0 Tc /Span<</ActualText<FEFF0009>>> BDC
4.018 -0.2 Td
( )Tj
我理解ActualText的作用(用于复制/粘贴/搜索),但我想知道我应该如何解释FEFF0009。它看起来像带有BOM字符的UTF-16字符串,用于表示制表符。这似乎是不正确的,因为它确实是一个空间。我想知道这里是否有特殊含义?
答案 0 :(得分:2)
..这似乎不正确,因为它确实是一个空间。
不,这真的是一个标签。
14.9.4替换文字
注1:正如可以为图像和其他不能自然转换为文本的项目提供替代描述(如前面的子条款所述),可以为转换为文本但在其中表示的内容指定替换文本。一种非标准的方式。
(PDF 32000-1:2008)
PDF文本引擎不支持“标签”的概念。在这种情况下,InDesign通过在文本流中插入空格来模仿制表符的功能,并且可以设置空间宽度以匹配原始制表符跨越的距离或使用较大的相对定位对于文本的其余部分(它在此处执行的操作:代码段中4.018
的水平位移)。
一般的想法是在选项卡的位置上呈现空间,但是当您复制此文本并粘贴到其他位置时,您将获得 tab 字符。我想只插入'空格'才能复制。