图像转换库:Word,PDF,Excel到图像

时间:2011-01-18 21:38:03

标签: image image-processing

我们要求将Excel,PDF和Word中的任何传入文档转换为图像。有什么建议吗?

我不确定ImageMagik是否会这样做,但我的理解仅仅是图像的格式转换,我猜也是处理PDF。 Excel和Word怎么样?

提前致谢

3 个答案:

答案 0 :(得分:6)

您可以先使用以下内容将所有内容转换为pdf:

$ libreoffice --headless --invisible --convert-to pdf *. libreofficeextension

然后使用imagemagick ...

你可能在单词中有一些格式问题,特别是在powerpoint中

答案 1 :(得分:1)

你是对的 - imagemagick 不会处理MS Office格式,因为它只处理图像格式转换。

对于PDF,可以直接使用imagemagick:

convert -density 400 filename.pdf filename.jpeg

它将为您提供文件:

  • 文件名[0] .JPG
  • 文件名[2] .JPG
  • ...
  • 文件名[N-1] .JPG

其中N是文档中的页数。 pdf2ps将实现相同的目标,但您需要使用命令行参数来获得相同的输出质量。

对于MS Office产品,我记得有一些API允许您访问套件的功能(这是MS Office 2007,来自内存),比如打开文件并将其导出为PDF。如果您可以了解PDF格式,那么您可以使用上面的方法将其转换为图像。一些负面观点:

  • 这是很多年前我以前的工作,我不记得究竟是什么叫它或者如何使用它。
  • 我记得输出PDF格式不是很好(不是100%像它出现在屏幕上)但它可读。自从我上次使用它以来,这可能有所改善。
  • 我有一个模糊的回忆,它在后台启动了一个Excel窗口,所以它不完全是一个命令行解决方案(可能不适合服务器)

答案 2 :(得分:0)

相当古老的问题仍然是我解决的问题:

  1. 使用Windows机器
  2. 安装MS Office套装
  3. 使用https://officetopdf.codeplex.com/将任何办公室格式转换为PDF
  4. 将Imagemagick用于pdf到图像格式。
  5. 希望它有所帮助。