我正在尝试使用python-docx解析docx文件。该文件包含图像和文本。基本上,我需要一种方法来从文件中获取图像(InlineShape对象)并将其另存为单独的图像(例如“ smth.jpg”)。有没有办法做到这一点?通过阅读API文档,看起来似乎并非如此,但也许我错过了一些东西。
答案 0 :(得分:0)
好的,我想出了办法。将docx文件转换为zip并从中解压缩。这不是最佳选择,但对我来说仍然很不错。
答案 1 :(得分:0)
docx2python
将为您提取这些图像。
from docx2python import docx2python
content = docx2python('my_document.docx', 'output_image_directory')
图像将位于您提供的任何目录中。