我正在尝试使用Ubuntu中的python获取与文件关联的元数据列表。
不使用python,命令“extract”工作得很好,但我不知道如何在python中使用它,我总是收到一条消息,说“extract”没有定义。
答案 0 :(得分:4)
我假设您询问“摘要”标签下Windows“属性”对话框中显示的元数据。 (如果没有,请忽略这一点。)以下是我如何管理它。
if __name__ == '__main__':
开头的最后一个块。将文件另存为property_reader.py
,并调用其property_sets(filepath)
方法。此方法返回生成器对象。您可以遍历生成器以查看所有属性及其值。你可以像这样实现它:
# Assuming 'property_reader.py' is the name of the module/file in which you saved Tim Golden's code...
import property_reader
propgenerator = property_reader.property_sets('[your file path]')
for name, properties in propgenerator:
print name
for k, v in properties.items ():
print " ", k, "=>", v
上述代码的输出如下所示:
DocSummaryInformation
PIDDSI_CATEGORY => qux
SummaryInformation
PIDSI_TITLE => foo
PIDSI_COMMENTS => flam
PIDSI_AUTHOR => baz
PIDSI_KEYWORDS => flim
PIDSI_SUBJECT => bar
答案 1 :(得分:1)
extract
基于libextractor库。您可以通过在Ubuntu上安装python-extractor包来从Python访问该库。
答案 2 :(得分:0)
如果您使用的是Windows,则问题已在SO上解决。