循环问题解析xml树

时间:2015-11-25 17:43:44

标签: xml python-2.7

我需要按顺序解析许多xml树...我做了一个'for'循环,它适用于第一个文件,bur在启动第二个文件时它只需要永远,并且从不打印答案或跟随其他文件

我有3个文件,这些文件都是来自同一个带有diffente名称的文件的副本来尝试循环,文件命名如下:

Medline_01.xml
Medline_02.xml
Medline_03.xml

我正在尝试跟随循环:

import xml.etree.cElementTree as etree    
import os

path = '/Users/brunap/Desktop/Work/Medline'   
listing = os.listdir(path)   
for file in listing:   
      if file.endswith('.xml'):    
           print file        
           data = os.path.join(path, file)    
           tree=etree.parse(data)    
           root = tree.getroot()    
           print root        
           print ""

它给了我以下结果

Medline_01.xml
<元素'PubmedArticleSet'位于0x10878bd80>

Medline_02.xml

P.S.:从这里我等待2小时,没有任何反应。第一个花了15分钟

有人可以帮助我吗?

1 个答案:

答案 0 :(得分:0)

实际上脚本很好,问题是文件太大了,计算机的内存没有处理运行脚本杀死它而从不跟随。在HPC群集中尝试时,它可以完美且快速地工作。

感谢任何方式的消化,帮助我解决其他问题。 :)