获取任意文件类型的缩略图

时间:2013-08-06 11:28:42

标签: python openoffice.org libreoffice pyuno

我需要从任意文件类型中获取缩略图。 (或尽我所能。)

对于类似文件类型的图像,我可以使用image-magick。对于像文件一样的文件,我想我会用:

文件 - > (与Pyuno一起开放办事处)PDF - > (Image-magick)Pdf到图像。 - >第一页的缩略图。

  1. 有更好的方法吗?
  2. 是否有可以执行此操作的网络服务?

1 个答案:

答案 0 :(得分:1)

是的,我认为你做得对。当然有一些网络服务虽然我没有使用这些的经验,所以我不会在这里列出任何。

创建文档的缩略图需要渲染,像docx这样的office文档非常复杂,只有极少数的库/应用程序可以渲染它们。 LibreOffice似乎是该领域最好的选择。

值得庆幸的是,已经有一个Python脚本,它提供了一个使用LibreOffice / OpenOffice进行转换的命令行前端:unoconv。它应该能够使用办公套件中的所有导出过滤器(包括png和pdf)。

我注意到直接导出到png的一些问题,但pdf导出大多数都很好。

顺便说一下:如果你遇到imagemagick的问题,你可能想尝试一下ghostscript。