为什么在Element上进行复制,使lxml.html.tostring返回转义字符

时间:2018-07-31 03:39:00

标签: python unicode lxml

喜欢以下内容:

In [1]: from lxml.html import fromstring, tostring

In [2]: import copy

In [3]: node = fromstring('<div>asdf\r\nasdf</div>')

In [4]: tostring(node, encoding='unicode')
Out[4]: '<div>asdf\r\nasdf</div>'

In [5]: tostring(copy.deepcopy(node), encoding='unicode')
Out[5]: '<div>asdf&#13;\nasdf</div>'

实际上有from html import unescape可以解决问题。 是否有更好的方法同时使用copytostring

0 个答案:

没有答案