我正在尝试检查XML元素(包括其所有子元素)中文本信息的MD5哈希值。这是与hipay服务互动所必需的。
def CheckMD5(tree):
m = hashlib.md5()
body = tree.find('result')
m.update(ET.tostring(ET.ElementTree(body).getroot(), method="html"))
return tree.find('md5content').text == m.hexdigest()
完整代码: https://github.com/fabiosantoscode/python-hipay/blob/master/hipay.py#L566
我的问题是,使用ElementTree.tostring
调用method="xml"
会使ElementTree崩溃关闭空元素的标记,但使用method="html"
我会失去大小写。例如:
>>> ET.tostring(ET.fromstring('<rt><a></a><CapName>asd</CapName></rt>'), method='xml')
'<rt><a /><CapName>asd</CapName></rt>'
>>> ET.tostring(ET.fromstring('<rt><a></a><CapName>asd</CapName></rt>'), method='html')
'<rt><a></a><CapName>asd</capname></rt>'
>>>
注意:
我根本不需要修改这个XML文档,我只需要提取<result>
元素的字符串数据。如果有其他图书馆允许我这样做,请注明。
答案 0 :(得分:1)
LH.tostring
不会折叠结束标记:
In [34]: import lxml.etree as ET
In [35]: import lxml.html as LH
In [36]: LH.tostring(ET.fromstring('<rt><a></a><CapName>asd</CapName></rt>'))
Out[36]: '<rt><a></a><CapName>asd</CapName></rt>'