喜欢以下内容:
In [1]: from lxml.html import fromstring, tostring
In [2]: import copy
In [3]: node = fromstring('<div>asdf\r\nasdf</div>')
In [4]: tostring(node, encoding='unicode')
Out[4]: '<div>asdf\r\nasdf</div>'
In [5]: tostring(copy.deepcopy(node), encoding='unicode')
Out[5]: '<div>asdf \nasdf</div>'
实际上有from html import unescape
可以解决问题。
是否有更好的方法同时使用copy
和tostring
?