我有XML数据,如下所示:
<root>
<results preview='0'>
<meta>
<fieldOrder>
<field>title</field>
<field>search</field>
</fieldOrder>
</meta>
<messages>
<msg type="DEBUG">msg1</msg>
<msg type="DEBUG">msg2</msg>
</messages>
<result offset='0'>
<field k='title'>
<value>
<text>text1</text>
</value>
</field>
<field k='search'>
<value>
<text>text2</text>
</value>
</field>
</result>
</results>
</root>
我想从标记text2
中提取标记值k='search'>value>text
。
在我的代码中,我正在尝试以下方法:
for atype in root.findall(".//text"):
print(atype.text)
这为我提供了text1
和text2
作为输出。其中我只需要text2
。我可以在我的程序中处理这个问题,使用if
语句来仅过滤text2
值,但我希望在findall()
中找到更强大的方法来执行此操作。
我尝试使用此代码专门仅提取text2
作为输出。
for atype in root.findall(".//field[@k='search']//text"):
print(atype.text)
但是这给了我一个错误 -
File "command_curl", line 49, in <module>
for atype in root.findall(".//field[@k='search']//text"):
File "/usr/lib64/python2.6/xml/etree/ElementTree.py", line 355, in findall
return ElementPath.findall(self, path)
File "/usr/lib64/python2.6/xml/etree/ElementPath.py", line 198, in findall
return _compile(path).findall(element)
File "/usr/lib64/python2.6/xml/etree/ElementPath.py", line 176, in _compile
p = Path(path)
File "/usr/lib64/python2.6/xml/etree/ElementPath.py", line 93, in __init__
"expected path separator (%s)" % (op or tag)
SyntaxError: expected path separator ([)
如果只输出text2
,我应该更改哪些内容?
答案 0 :(得分:0)
谢谢har07和tdelaney。你提到过我有一个旧版本的elementtree。在指向更新版本的python之后,代码现在正常工作。
答案 1 :(得分:0)
您可以使用以下示例从标记中提取文本
import xml.etree.ElementTree as ET
tree = ET.parse("sample.xml")
root = tree.getroot()
for tags in root.findall(".//text"):
print(tags.text)