Python:如何修改Microsoft Office文件的元数据?

时间:2016-06-01 04:59:20

标签: python-2.7 file python-3.x metadata

如何修改Microsoft Office Document的元数据?我找到了Jpg,PNG和PDF文件的结果数。任何人都可以建议Office文件元数据库吗?

1 个答案:

答案 0 :(得分:2)

对于较新的格式,它们通常只是压缩xml,因此您可以使用标准库来解压缩和解析xml。抓取文档创建者的一些代码以前是posted as an answer on stackoverflow

import zipfile, lxml.etree

# open zipfile
zf = zipfile.ZipFile('my_doc.docx')
# use lxml to parse the xml file we are interested in
doc = lxml.etree.fromstring(zf.read('docProps/core.xml'))
# retrieve creator
ns={'dc': 'http://purl.org/dc/elements/1.1/'}
creator = doc.xpath('//dc:creator', namespaces=ns)[0].text

对于较旧的格式,您可能需要查看hachoir-metadata library