我正在尝试使用Wand(Imagemagick绑定为python)将PDF的第一页(包含图像和文本)转换为图像。输出看起来像这样!!! http://i.stack.imgur.com/OdCMZ.jpg 这里的文字不是图像的一部分。图像不是完全跨越的。它只显示在一半。
如果PDF没有任何文字,那么它就像这样...... http://i.stack.imgur.com/NmcjO.jpg 这里的文字是图像的一部分
我不明白问题是文字还是图书馆。第一张图像如何也完全跨越。
答案 0 :(得分:0)
当pdf转换时,使用 Ghostscript 进行imagemagick。 如果你想要结果只有内部边框内容。 你可以使用'-dUseCropBox'选项。
import subprocess
cmd = [
'gs',
'-q',
'-dQUIET',
'-dSAFER',
'-dBATCH',
'-dNOPAUSE',
'-dNOPROMPT',
'-dMaxBitmap=500000000',
'-dAlignToPixels=0',
'-dGridFitTT=2',
'-dUseCropBox',
'-dTextAlphaBits=4',
'-dGraphicsAlphaBits=4',
'-r{0}x{0}'.format(200),
'-sDEVICE=jpeg',
'-dJPEGQ=100',
'-sOutputFile=%05d.jpg',
'test.pdf'
]
subprocess.call(cmd)