Question

当我想要访问非常长的XML元素的文本内容时，我遇到了麻烦。我正在使用xml.etree库。

我要解析的xml元素的大小约为400,000个字符，我只能得到当我这样做时，大约30 000个字符：

from lxml import etree

context = etree.iterparse(xml_document, events=['start','end'])

for action, element in context:
    if element.tag.endswith('tag_name'):
        if action=="start":
            result = element.text

有谁知道如何确保etree完全读取元素的文本？

谢谢

Answer 1

好的，我终于找到了自己问题的答案......

只需使用＆＃34;结束＆＃34;事件而不是＆＃34;开始＆＃34;如果你想确定etree读取标签的所有文本内容：

from lxml import etree

context = etree.iterparse(xml_document, events=['end'])

for action, element in context:
    if element.tag.endswith('tag_name'):
        if action=="end":
            result = element.text

etree incomplete child.text

1 个答案: