我有一批带有以下元数据属性的PDF文档:
语言:set([NL,DE,FR,EN])
我想迭代这些值,但它输出每个字符如:
s
e
t
(
[
...
E
N
,
]
)
我的猜测是该套装缺少报价。 set(["NL","FR","DE","EN"])
有没有办法让我仍然可以迭代这些值?如果是这样,我可以重写该属性。
答案 0 :(得分:1)
for lang in re.findall("[A-Z]{2}",metadata_text):
print lang
我想也许?
替代地
for lang in metadata_text[5:-2].split(","):
print lang