将PDF转换为图像后如何获取可读文本(带抗锯齿的文本)?

时间:2013-06-27 06:27:42

标签: pdf ghostscript

我在带有文字的PDF文档上使用了ghostscript。文本看起来像黑白位图。如何使用可读文本获取图像?

-r96
-dTextAlphaBits=1 
-sDEVICE=png16m

1 个答案:

答案 0 :(得分:7)

您可以为输出图像使用更高的分辨率,例如 -r300 设置 - dTextAlphaBits = 4 -sDEVICE = pnggray

-dTextAlphaBits=n
-dGraphicsAlphaBits=n

这些选项控制子样本抗锯齿的使用。强烈建议使用它们来生成输入文件的高质量光栅化。对于最佳输出,子采样框n的大小应为4,但较小的值可用于更快的渲染。为文本和图形内容单独启用抗锯齿。