标签: html unicode encoding beautifulsoup html-entities
我想将html文档的所有html实体都转换为Unicode而不是<,我如何实现我的目标?我可以将htmlperser unescape方法中的html-entities列入黑名单吗?
<