将S3中提取的PDF和PPTX文件转换为JPG格式

时间:2019-06-26 20:29:05

标签: python-3.x amazon-web-services amazon-sagemaker

我正在AWS SageMaker中为正在处理的项目使用Jupyter Notebook(Jupyter Notebook正在运行conda-python3),并且我需要转换几种格式为PPTX,PPT和PDF的文件,转换为图像格式(JPG,JPEG,PNG)。我相信我遇到的主要问题是我无法将库下载到Jupyter实例中,因为它没有可借鉴的常规下载路径。

我曾经尝试使用Wand和Imagemagick,但是我总是遇到问题。我还使用了一些pdf2jpg之类的第三方软件包,但它们都不起作用(我相信这是因为我不知道如何在Jupyter中下载Poppler库)。

我认为以下问题是由于当Imagemagick以64位运行时我运行了32位Python,但我不知道如何检查我在Python上运行的位大小或如何在Jupyter上下载32位Imagemagick

ImportError: MagickWand shared library not found.
You probably had not installed ImageMagick library.

这种情况在我打电话

时发生
from wand.image import Image

你能告诉我吗?

1 个答案:

答案 0 :(得分:0)

您是否可以尝试同时安装Wandmagickwand,也可以使用sudo yum install ImageMagick-devel安装Wand库 安装这些库后,我能够导入wand.image

参考:http://docs.wand-py.org/en/latest/guide/install.html

感谢您使用Amazon SageMaker!