Microsoft Powerpoint Python Parser

时间:2010-07-05 17:47:59

标签: python parsing powerpoint

我正在寻找一个基于python的微软Office解析器 - 特别是powerpoint。

我希望能够在python中解析PPT并从powerpoint文件中提取文本和图像等内容。

是否有图书馆?

2 个答案:

答案 0 :(得分:5)

我认为没有这样的图书馆。

您可以使用pywin32程序包访问PowerPoint的COM。

这是一个非常好的介绍,使用win32com模块自动执行PowerPoint编写的任务: http://www.s-anand.net/blog/automating-powerpoint-with-python/

答案 1 :(得分:3)

你可能会发现这样的野兽,但我敢打赌它;你在一起寻找两种罕见的物业。

您可以考虑使用Open Office SDK,它已经拥有大量机器来读取电源点文件,并将其滥用于您的目的。这是Java,而不是Python,但我的猜测是学习Java的学习曲线比学习曲线要​​小得多,以便弄清楚如何阅读PowerPoint文件。