我正在尝试将PDF转换为图像,但是注意到当PDF嵌入了字体时,转换为图像会导致内容丢失(内容是嵌入字体中的内容)。
当我说嵌入字体时,我的意思是文本实际上可以在PDF中选择。这意味着PDF不仅仅是光栅化图像(例如扫描文档)。我不确定“嵌入字体”是否是正确的术语。
在任何情况下,如何在转换为图像之前或期间“压平”或“栅格化”PDF文档?
我当前的命令如下所示:
gs \
-dSAFER \
-dBATCH \
-dNOPAUSE \
-dQUIET \
-dFirstPage=1 \
-dLastPage=1 \
-r288 \
-sDEVICE=tiffgray \
-sOutputFile=output.tif \
input.pdf
答案 0 :(得分:1)
文本可选的事实并不意味着它使用的字体实际上是嵌入的。但即使不是文本也不应该遗漏。
你还没有说过你使用的是哪个版本的Ghostscript,也没有说过哪个平台(虽然我从命令中推断出Linux)。
我建议您尝试使用当前版本的GS(9.02),如果仍然遇到问题,请在http://bugs.ghostscript.com报告错误。您需要附加一个样本文件,最好是尽可能小,并使用命令行来重现问题。
我还建议删除-dQUIET,这可能是GS试图给你打电话但是消息被抑制了。