从Word和Excel文件中提取元数据?

时间:2017-02-22 19:56:38

标签: python powershell metadata

我在Windows 7操作系统中有一系列嵌套文件夹,都是保存文件。文件是Word和Excel。我想从每个文件中提取作者所有者修改日期创建日期元数据字段,并输出到文本文件。

我第一次尝试这样做涉及使用PowerShell。 The code presented by the OP here效果很好,但不会通过文件夹递归。我试验了将'Get-ChildItem'与funMetadata函数结合起来的各种方法,但无法这样做。由于它不适用于OP,并且SO社区没有提供解决方案,因此尝试继续尝试修复此代码似乎是不明智的。相反,我专注于通过替换我自己的元数据字段来修改OP的解决方案(下面),但输出文本文件只是简单地说“作者”后跟一个空白页面。这是我试过的:

(导航到根文件夹):Get-ChildItem -Recurse | Select-Object Authors | Out-file "C:\text5.txt"

(顺便说一句,元数据肯定存在于文件中 - 我通过使用OP原始的,无法复制的脚本来了解这一点)。

尝试不同的方法,我下载了两个python模块 - hachoiroletools - 但是一旦我安装了它们,我就不知道从哪里开始了。它似乎没有任何文档。

有人对我有建议吗?

编辑:我刚刚发现了一些新信息here,这可能是一个重复的问题。我讨厌现在删除它,以防有人正在处理答案。为任何困惑道歉

0 个答案:

没有答案