使用Python解析目录中所有文件的XML标记值

时间:2014-10-01 11:41:33

标签: python xml python-2.7 xml-parsing

尽管预先存在类似的问题,但我无法实现这一飞跃。帮助会受到重视!

  • 我试图以递归方式解析目录/子目录中的所有xml文件
  • 我正在寻找标签"运营商ID"
  • 的价值

示例源XML:

<Operators>
   <Operator id="OId_LD">
   <OperatorCode>LD</OperatorCode>
   <OperatorShortName>ARRIVA THE SHIRES LIMIT</OperatorShortName>

这是我到目前为止的代码:

from xml.dom.minidom import parse
import os
def jarv(target_folder):
    for root,dirs,files in os.walk(target_folder):
        for targetfile in files:
            if targetfile.endswith(".xml"):
                print targetfile
                dom=parse(targetfile)
                name = dom.getElementsByTagName('Operator_id')
                print name[0].firstChild.nodeValue

这是我正在运行的终端命令:

python -c "execfile('xml_tag.py'); jarv('/Users/admin/Projects/AtoB_GTFS')"

这是我收到的错误:

tfl_64-31_-37434-y05.xml

encodings.xml
Traceback (most recent call last):
  File "<string>", line 1, in <module>
  File "xml_tag.py", line 8, in jarv
    dom=parse(targetfile)
  File "/usr/local/Cellar/python/2.7.8_1/Frameworks/Python.framework/Versions/2.7/lib/python2.7/xml/dom/minidom.py", line 1918, in parse
    return expatbuilder.parse(file)
  File "/usr/local/Cellar/python/2.7.8_1/Frameworks/Python.framework/Versions/2.7/lib/python2.7/xml/dom/expatbuilder.py", line 922, in parse
    fp = open(file, 'rb')
IOError: [Errno 2] No such file or directory: 'encodings.xml'
(frigo)andytmac:AtoB_GTFS admin$ python -c "execfile('xml_tag.py'); jarv('/Users/admin/Projects/AtoB_GTFS')"
tfl_64-31_-37434-y05.xml

如果我在&#39;打印目标文件&#39;之后注释掉了代码。它列出了我拥有的所有xml文件。

感谢您的协助,

安迪

1 个答案:

答案 0 :(得分:0)

您没有找到正确的位置(相对路径):当您使用for root, dirs, files in os.walk(target_folder):时,files是目录root中的文件名列表,而不是他们的绝对路径。

尝试按dom=parse(targetfile)

重新启动dom = parse(os.sep.join(root, targetfile))