过滤(短语)文档中的特定标记

时间:2014-04-30 14:36:59

标签: filtering

我在OSX上,我想知道是否有一个软件允许我从文档中提取特定标签及其价值。

我有一个XML,其中包含标记中包含的路径信息,如下所示:

<pathurl>file://localhost/disk1/pahttofile.mov</pathurl>

我只需要提取这些标签和路径信息。

如何在不必查找和复制粘贴数百万次的情况下执行此操作?

THX! 卡雷尔。

1 个答案:

答案 0 :(得分:0)

在Python中:

import xml.etree.ElementTree as ET

def getpathurls(filename):
    tree = ET.parse(filename)
    root = tree.getroot()
    return [path.text for path in root.findall('pathurl')]

根据文件格式的不同,这可能会为您提供所需的结果。

(我知道这不是你想要的,但这是回答StackOverflow主题问题的唯一方法)