ps2pdf - 强制/保留纯文本

时间:2014-02-24 20:13:16

标签: pdf ghostscript

如果原始pdf包含真实文本,如何使用ps2pdf并强制它保留纯文本?

有时,如果PDF的某些区域带有背景颜色,则会将整个pdf转换为图像!?

如何强制ps2pdf保留纯文字?

语法:

pdf2ps file.pdf file.pdf.ps
ps2pdf -dPDFSETTINGS=/screen -dColorImageResolution=50 -dGrayImageResolution=50 file.pdf.ps file_output.pdf

PDF示例

www.bluemachines.dk/pdf_comp/dyn.pdf

1 个答案:

答案 0 :(得分:1)

第一个答案是直接驱动Ghostscript,不要使用ps2pdf(或pdf2ps)。

如果要将文本转换为图像,则最有可能因为原始PDF文件具有透明度,因此无法在PostScript中表示。解决这个问题的唯一方法是提供透明区域。

没有办法维护文本的编码,但一般来说它不会改变。但是,这在很大程度上取决于输入中使用的字体和编码。如果没有看到一个例子,我不能说更多。