标签: html python-3.6
我通过python获取外部不受信任的html(从etherpad导出)。我如何确定不包含“错误代码”?例如,我当然可以全部删除,但是已经全部删除了吗?有没有可以可靠工作的图书馆?
答案 0 :(得分:0)
我通过使用python模块bleach
bleach