当我尝试这个时
$ convert some_pdf.pdf[0] some_image.png
得到的.png看起来不错,但是包含在一个更大的游说中。因此,原始pdf幻灯片的内容在.png图像的左下方显示为角色。
任何线索?
答案 0 :(得分:0)
我的理论是......
(1)... PDF对其({可选] CropBox
,TrimBox
,{{1}使用一些奇怪的(但“合法的”)甚至“非法”定义与(必需)BleedBox
设置相关的或/和ArtBox
设置,
(2)...和ImageMagick,不知道如何处理这种特殊设置,使用MediaBox(它们全部包含所有内容)来重新整理页面内容。
例如,MediaBox
(如果与CropBox
不同)告诉PDF查看器或打印机驱动程序仅渲染整个页面的选定部分,并将此部分缩放到可用空间。< / p>
您可以在
的帮助下轻松验证MediaBox
'通常'文件的结果将是:
pdfinfo -box -f 1 -l 100 your.pdf | grep Box:
'奇怪'文件的结果可能是:
Page 1 MediaBox: 0.00 0.00 595.00 842.00
Page 1 CropBox: 0.00 0.00 595.00 842.00
Page 1 BleedBox: 0.00 0.00 595.00 842.00
Page 1 TrimBox: 0.00 0.00 595.00 842.00
Page 1 ArtBox: 0.00 0.00 595.00 842.00
Page 2 MediaBox: 0.00 0.00 595.00 842.00
Page 2 CropBox: 0.00 0.00 595.00 842.00
Page 2 BleedBox: 0.00 0.00 595.00 842.00
Page 2 TrimBox: 0.00 0.00 595.00 842.00
Page 2 ArtBox: 0.00 0.00 595.00 842.00
[...]
但是,为了验证(或伪造)这个理论,我需要从原始输入PDF中访问样本文件