是否有Python库为各种文档文件格式创建缩略图?

时间:2014-02-02 14:53:33

标签: python image thumbnails imaging

我想从各种“文档”文件格式生成缩略图,例如odt,doc(x)和ppt(x),还有来自Python应用程序的mp4,psd,tiff(以及可能的其他)。据我所知,每种格式至少有一个开源应用程序可以生成预览图像/缩略图(例如LibreOffice,ffmpeg)或至少提取嵌入的缩略图(例如imagemagick)。

我的主要问题是每个应用程序/库都使用不同的命令行选项,因此我正在寻找一个Python库(或统一的CLI工具),它提供了一个高级API来生成具有指定维度的缩略图,给定文件名的质量级别并调用适当的外部工具(理想情况下包括捕获异常,段错误和超时)。奖励积分,如果它可以生成多个缩略图(例如每页一页,页面X-Y,每Z秒,但最多N个图像)。

有谁知道这样的库/实用程序? (边界条件:文件可能包含敏感材料或可能非常大,因此无需任何网络通信即可使用,无法使用外部Web服务。)

如果在Python中没有这样的东西,那么本地可安装的Web服务也可以。

2 个答案:

答案 0 :(得分:5)

我最终编写了自己的库(名为anythumbnailer,麻省理工学院许可证),该库可以满足我的直接需求。该库不是我想象的(只有基本的缩略图,不支持尺寸,...)但它可以在ffmpeg的帮助下在Linux上生成doc(x),xls(x),ppt(x),video和pdf的缩略图,LibreOffice和ffmpeg。

答案 1 :(得分:2)

你可以看看Preview generator。 preview-generator是一个用于生成预览的库 - 所有基于文件的内容的缩略图,pdf,文本和json概述。通过该模块,您可以访问几乎任何类型文件的jpeg,pdf,text,htlm和json预览。它还包括一个缓存机制,因此您不必关心预览存储。