我正在寻找一个基于python的微软Office解析器 - 特别是powerpoint。
我希望能够在python中解析PPT并从powerpoint文件中提取文本和图像等内容。
是否有图书馆?
答案 0 :(得分:5)
我认为没有这样的图书馆。
您可以使用pywin32程序包访问PowerPoint的COM。
这是一个非常好的介绍,使用win32com模块自动执行PowerPoint编写的任务: http://www.s-anand.net/blog/automating-powerpoint-with-python/
答案 1 :(得分:3)
你可能会发现这样的野兽,但我敢打赌它;你在一起寻找两种罕见的物业。
您可以考虑使用Open Office SDK,它已经拥有大量机器来读取电源点文件,并将其滥用于您的目的。这是Java,而不是Python,但我的猜测是学习Java的学习曲线比学习曲线要小得多,以便弄清楚如何阅读PowerPoint文件。