如果原始pdf包含真实文本,如何使用ps2pdf
并强制它保留纯文本?
有时,如果PDF的某些区域带有背景颜色,则会将整个pdf转换为图像!?
如何强制ps2pdf
保留纯文字?
语法:
pdf2ps file.pdf file.pdf.ps
ps2pdf -dPDFSETTINGS=/screen -dColorImageResolution=50 -dGrayImageResolution=50 file.pdf.ps file_output.pdf
PDF示例
www.bluemachines.dk/pdf_comp/dyn.pdf
答案 0 :(得分:1)
第一个答案是直接驱动Ghostscript,不要使用ps2pdf(或pdf2ps)。
如果要将文本转换为图像,则最有可能因为原始PDF文件具有透明度,因此无法在PostScript中表示。解决这个问题的唯一方法是提供透明区域。
没有办法维护文本的编码,但一般来说它不会改变。但是,这在很大程度上取决于输入中使用的字体和编码。如果没有看到一个例子,我不能说更多。