在浏览我的pdf正则表达式时,在很多地方我看到一些字符被方框替换,这是一些ASCII代码
有什么方法可以解决这个问题吗?
我已查看此链接
http://www.tableausoftware.com/support/knowledge-base/square-boxes
http://acrobatusers.com/tutorials/text-matching-regular-expressions
和其他人但没有找到任何解决方案... aatched是方盒子的样子......
答案 0 :(得分:2)
正如stema所说,这与正则表达式无关。
也不是关于某些“pdf转义序列”,因为PDF使用二进制安全文本编码。
这些方块通常显示在某些字符的位置,而这些字符在所选字体中没有表示。通常情况下,排版软件会使用“更好”的Unicode替代品替换某些引号或其他字符;但字体没有这些字符。
您可以尝试将PDF中的文本复制/粘贴到其他文档中并替换字体,甚至使用一些PDF编辑工具(enfocus PitStop是最受欢迎的文件之一;它便宜但不免费)用另一个更完整的字体替换字体。
答案 1 :(得分:1)
首先,这与正则表达式无关,除了您正在编写的文档是关于正则表达式。
我假设,被正方形替换的序列是\s
,不是吗?
我认为这里的问题是一些正则表达式快捷方式在pdf创建过程中被解释为转义序列,因此不会按字面打印。
你没有写下你如何创建你的pdf,但是当你想要从字面上打印它们时,我会认为你可以逃避反斜杠。
因此,当您想在pdf中看到\s
时,请在源格式中输入\\s
。 (如果你想在某个地方使用转义反斜杠打印\\
,那么请写\\\\
)。
答案 2 :(得分:0)
哈维尔的回答几近完成。但是,让我补充一点:
您将很少有机会通过在其应用程序首选项中切换某个设置,使用“替代”字体让Acrobat Reader显示方框。
IIRC,该设置称为'使用本地字体'。您通常可以在首选项设置的页面显示部分找到它,但在不同的版本中,Adobe不断添加,删除或重新定位不同的设置......
背景信息:如果您不已启用使用本地字体,那么您需要Reader才能使用PDF嵌入字体显示所有文字。如果嵌入了字体但是错过了一些必需的字形,启用所述设置可能在系统上找到所需的字体来呈现文本,或者Reader可以使用其内置的 Multiple Master 字体会试图伪造原始字形的外观,或多或少......