我有一个PDF文档存储库,这些文档中包含的大部分文本都是以Comic Sans格式化的。我想把它改成类似Arial的东西。 原始字体嵌入在文档中。 我还没有找到任何现有的工具来为我做这个(我在Linux上),我想知道它是否可能以编程方式来做。 Python库是完美的,但任何编程语言的库都可以。
在哪个库中我能用最少的努力替换字体?我会使用API的哪些部分?
答案 0 :(得分:1)
有一些商业工具可以做到这一点 - 其中一个是来自callas软件的pdfToolbox(警告 - 我是该公司的附属公司)。
然而 - 即使这个功能存在并且有时会被使用 - 结果通常是完全不合需要的,而且我没有看到很多上下文,它被用于超过非常特定的文件。通常只取得有限的成功。至于这种替换只能在我提到的工具中作为手动操作使用 - 而不是在自动模式下。
根据这些文件的复杂程度,您可能会更好地将文档中的所有文本提取到RTF之类的内容,执行您需要的任何操作,然后重新生成PDF。听起来像是一种迂回的方式,但我猜测在大多数情况下结果会更好......