使用python-docx从docx文件中读取coreproperties关键字

时间:2014-03-25 03:39:38

标签: python keyword python-docx

从脚本here我看到如何使用python-docx的coreproperties函数设置文档关键字。我想查看其他人编写的文档中已有的关键字。是否有getcoreproperties函数或关键字属性或类似的东西?

我已经在文件夹C:\ Python27 \ Lib \ site-packages \ python_docx-0.5.0-py2.7.egg \ docx中找到了没有.py文件中没有字符串"核心"在他们中间,我在一些事情上称为doc(),但没有发现任何有希望的事情。我应该在哪里/如何寻找这类事情的线索?

1 个答案:

答案 0 :(得分:0)

从v0.5.0开始,python-docx库不支持核心属性。但事实上,这应该相对容易补救。

python-pptx姐妹项目支持核心属性,如下所述: http://python-pptx.readthedocs.org/en/latest/api/presentation.html#coreproperties-objects

由于这两个项目基于相同的体系结构,因此该代码应该基本上可以重用。事实证明,核心属性位在Open Packaging Convention中是通用的,对于所有三种MS Office XML文件格式都是相同的。

如果您在GitHub问题跟踪器上添加问题,我会看到我们能够尽快达成问题。 https://github.com/python-openxml/python-docx/issues