如何使用以下代码读取大量xml文件(超过1GB):
import xml.etree.ElementTree as ET
tree = ET.parse(file)
doc = tree.getroot()
abstracts = doc.findall('PubmedArticle/MedlineCitation/Article/Abstract')
for abstract in abstracts:
abs_text = abstract.findall('AbstractText')
ab = ''
for txt in abs_text:
ab += txt.text
collections.col_pubmed_xmls.insert({'text': ab, 'tag': tag})
执行此代码后,错误表明该文件无法在此行中打开:
ET.parse(file)
我可以使用此代码阅读小文件 怎么办?