如何修复PDF格式的方框?

时间:2011-09-21 15:39:27

标签: pdf

在浏览我的pdf正则表达式时,在很多地方我看到一些字符被方框替换,这是一些ASCII代码

有什么方法可以解决这个问题吗?

我已查看此链接

http://www.tableausoftware.com/support/knowledge-base/square-boxes
http://acrobatusers.com/tutorials/text-matching-regular-expressions

和其他人但没有找到任何解决方案... aatched是方盒子的样子......

enter image description here

3 个答案:

答案 0 :(得分:2)

正如stema所说,这与正则表达式无关。

也不是关于某些“pdf转义序列”,因为PDF使用二进制安全文本编码。

这些方块通常显示在某些字符的位置,而这些字符在所选字体中没有表示。通常情况下,排版软件会使用“更好”的Unicode替代品替换某些引号或其他字符;但字体没有这些字符。

您可以尝试将PDF中的文本复制/粘贴到其他文档中并替换字体,甚至使用一些PDF编辑工具(enfocus PitStop是最受欢迎的文件之一;它便宜但不免费)用另一个更完整的字体替换字体。

答案 1 :(得分:1)

首先,这与正则表达式无关,除了您正在编写的文档是关于正则表达式。

我假设,被正方形替换的序列是\s,不是吗?

我认为这里的问题是一些正则表达式快捷方式在pdf创建过程中被解释为转义序列,因此不会按字面打印。

你没有写下你如何创建你的pdf,但是当你想要从字面上打印它们时,我会认为你可以逃避反斜杠。

因此,当您想在pdf中看到\s时,请在源格式中输入\\s。 (如果你想在某个地方使用转义反斜杠打印\\,那么请写\\\\)。

答案 2 :(得分:0)

哈维尔的回答几近完成。但是,让我补充一点:

您将很少有机会通过在其应用程序首选项中切换某个设置,使用“替代”字体让Acrobat Reader显示方框。

IIRC,该设置称为'使用本地字体'。您通常可以在首选项设置的页面显示部分找到它,但在不同的版本中,Adobe不断添加,删除或重新定位不同的设置......

背景信息:如果您已启用使用本地字体,那么您需要Reader才能使用PDF嵌入字体显示所有文字。如果嵌入了字体但是错过了一些必需的字形,启用所述设置可能在系统上找到所需的字体来呈现文本,或者Reader可以使用其内置的 Multiple Master 字体会试图伪造原始字形的外观,或多或少......