在python 3.6中提取xlsx工作簿文件元数据/属性

时间:2018-12-26 10:18:34

标签: python metadata xlsx

如何使用Python读取存储在xlsx文件中的属性/元数据,例如标题,作者,主题,最后修改的内容和关键字?我使用了 xlrd 库,但是没有提取这些实体的属性。 感谢您的帮助

2 个答案:

答案 0 :(得分:1)

您可能对openpyxl感兴趣:

让您入门的东西可能像这样:

from openpyxl import load_workbook
wb = load_workbook('yourfile.xlsx')
wb.properties

这是示例输出:

<openpyxl.packaging.core.DocumentProperties object>
Parameters:
creator=u'User', title=None, description=None, subject=None, identifier=None,
language=None, created=datetime.datetime(2018, 12, 11, 9, 55, 2),
modified=datetime.datetime(2018, 12, 11, 10, 30, 38), lastModifiedBy=u'User',
category=None, contentStatus=None, version=None, revision=None, keywords=None,
lastPrinted=None

这是您可以使用的东西吗?

答案 1 :(得分:0)

您应该查看os库:https://docs.python.org/3/library/os.html,因为元数据存储在文件级内容的上方。
示例:os.path.getmtime为您提供上次修改时间。