替换Python3中的HTML特殊字符代码

时间:2017-07-17 10:53:23

标签: html python-3.x

我收到了HTML文件,它们包含类似"(“),ü(ü)等字符串。

我需要他们可读的。所以我可以使用str.replace()。但是没有Python3的包/库,它自己知道所有字符代码并且可以处理它吗?

2 个答案:

答案 0 :(得分:1)

您可以使用html.unescape()

import html
print(html.unescape('"ü'))

答案 1 :(得分:0)

选择解决方案here。它被称为decode(或unescape),是的,有一个库。