我需要按顺序解析许多xml树...我做了一个'for'循环,它适用于第一个文件,bur在启动第二个文件时它只需要永远,并且从不打印答案或跟随其他文件
我有3个文件,这些文件都是来自同一个带有diffente名称的文件的副本来尝试循环,文件命名如下:
Medline_01.xml
Medline_02.xml
Medline_03.xml
我正在尝试跟随循环:
import xml.etree.cElementTree as etree
import os
path = '/Users/brunap/Desktop/Work/Medline'
listing = os.listdir(path)
for file in listing:
if file.endswith('.xml'):
print file
data = os.path.join(path, file)
tree=etree.parse(data)
root = tree.getroot()
print root
print ""
它给了我以下结果
Medline_01.xml
<元素'PubmedArticleSet'位于0x10878bd80>
Medline_02.xml
P.S.:从这里我等待2小时,没有任何反应。第一个花了15分钟 有人可以帮助我吗?答案 0 :(得分:0)
实际上脚本很好,问题是文件太大了,计算机的内存没有处理运行脚本杀死它而从不跟随。在HPC群集中尝试时,它可以完美且快速地工作。
感谢任何方式的消化,帮助我解决其他问题。 :)