如何使用xml.etree.ElementTree读取一个巨大的xml文件

时间:2017-02-28 15:15:52

标签: python xml elementtree

如何使用以下代码读取大量xml文件(超过1GB):

import xml.etree.ElementTree as ET
tree = ET.parse(file)
doc = tree.getroot()
abstracts = doc.findall('PubmedArticle/MedlineCitation/Article/Abstract')
for abstract in abstracts:
    abs_text = abstract.findall('AbstractText')
    ab = ''
    for txt in abs_text:
        ab += txt.text
    collections.col_pubmed_xmls.insert({'text': ab, 'tag': tag})

执行此代码后,错误表明该文件无法在此行中打开:

 ET.parse(file)

我可以使用此代码阅读小文件 怎么办?

0 个答案:

没有答案