将pdf转换为Image:间距问题

时间:2014-09-07 15:12:13

标签: python pdf imagemagick wand

我正在尝试使用Wand(Imagemagick绑定为python)将PDF的第一页(包含图像和文本)转换为图像。输出看起来像这样!!! http://i.stack.imgur.com/OdCMZ.jpg 这里的文字不是图像的一部分。图像不是完全跨越的。它只显示在一半。

如果PDF没有任何文字,那么它就像这样...... http://i.stack.imgur.com/NmcjO.jpg 这里的文字是图像的一部分

我不明白问题是文字还是图书馆。第一张图像如何也完全跨越。

1 个答案:

答案 0 :(得分:0)

当pdf转换时,使用 Ghostscript 进行imagemagick。 如果你想要结果只有内部边框内容。 你可以使用'-dUseCropBox'选项。

import subprocess
cmd = [
    'gs',
    '-q',
    '-dQUIET',
    '-dSAFER',
    '-dBATCH',
    '-dNOPAUSE',
    '-dNOPROMPT',
    '-dMaxBitmap=500000000',
    '-dAlignToPixels=0',
    '-dGridFitTT=2',
    '-dUseCropBox',
    '-dTextAlphaBits=4',
    '-dGraphicsAlphaBits=4',
    '-r{0}x{0}'.format(200),
    '-sDEVICE=jpeg',
    '-dJPEGQ=100',
    '-sOutputFile=%05d.jpg',
    'test.pdf'
]
subprocess.call(cmd)