我是否需要安装字体才能在我的pdf中转换文本?

时间:2014-01-17 07:04:53

标签: windows pdf imagemagick ghostscript

我正在玩一些pdf,并且有一些在结果图像中没有文字。

其中两份文件:

http://comptroller.nyc.gov/wp-content/uploads/documents/CAFR2013.pdf  http://www.sfcontroller.org/modules/showdocument.aspx?documentid=4935

我做了一些谷歌搜索,似乎我可能需要获得一些新字体的支持。这篇博客文章让我觉得:

http://tech.superhappykittymeow.com/?p=254

如何获取我需要的字体并在Windows 8上安装它们?

2 个答案:

答案 0 :(得分:0)

好的关于丢失字体的帖子是指Ghostscript的非常旧分支,你肯定不会得到当前规范版本的错误(ESP分支被合并回主干许多几年前,不再存在)。你可能会得到错误的字体,这会导致文本出现乱码,但就是这样。

您发布的第一个网址似乎是一个HTML网页,第二个网址不完整,所以我得到了一个404页面。

如果您希望字体与Ghostscript一起使用,则需要在 Ghostscript 上安装它们,而不是Windows。确实,当你在Windows上安装Ghostscript时,它会提供将你当前的Windows字体添加到Ghostscript知道的字体,并将新字体添加到同一文件夹中(通常,但我没有在Windows 8上尝试过这种情况)允许使用Ghostscript也看他们。但您可以将它们添加到GS而不将它们添加到Windows,反之亦然。

您还可以定义替代字体。假设您需要一种名为MyFont-Itaiic的字体并且您没有它,但您确实拥有YourFont-Italic,并且您碰巧知道它们是相同的,除了轻微的繁荣。您可以将YourFont-Italic定义为MyFont-Italic的替代品。

至于获取字体,您可以在网上搜索以查看字体或克隆是否可以免费获得,或者您可以从字体代工厂购买。

答案 1 :(得分:0)

documentid=4935中报告“未嵌入”的字体是Arial,Helvetica,Times和Times New Roman(每种都有几种样式)。这些可以安全地替换为您系统上的标准字体:Arial和Times New Roman,如果在MS Windows,Helvetica和Times上,如果在Mac OS X上。

如果您遇到文档中的一个或多个其他字体(Helvetica Neue,Monotype Corsiva,Nyala)的问题,则问题可能是您工作流程中的某个程序没有正确识别这些字体的嵌入子集。

加成

使用Acrobat Pro检查其他文档:其所有字体都作为子集嵌入,因此如果您的工作流程合理,则根本不应该看到任何丢失的字体。