lxml.html将引用网址。但我需要在处理后取消引用它。如何在处理lxml.html后取消引用URL?
import lxml.html as html
mandarin = '<a name="中文"/><a href=中文></a>'
e = html.fromstring(mandarin)
print(html.tostring(e, encoding='unicode'))
结果:
<span><a name="%E4%B8%AD%E6%96%87"></a><a href="%E4%B8%AD%E6%96%87"></a></span>
我期待:
<span><a name="中文"/><a href="中文"/></span>