标签: python html plaintext
我正在开发一个涉及将大量HTML内容转换为纯文本/文本的项目。我有一个自定义编写的模块可以完成这项工作,但我想知道是否有一些标准工具可以帮助完成工作。
答案 0 :(得分:10)
Html2Text似乎是个不错的选择
答案 1 :(得分:4)
这是一个执行HTML解析的python库:
BeautifulSoup是另一种选择。