使用Python将HTML转换为纯文本的最佳方法

时间:2009-11-03 15:33:48

标签: python html plaintext

我正在开发一个涉及将大量HTML内容转换为纯文本/文本的项目。我有一个自定义编写的模块可以完成这项工作,但我想知道是否有一些标准工具可以帮助完成工作。

2 个答案:

答案 0 :(得分:10)

Html2Text似乎是个不错的选择

答案 1 :(得分:4)

这是一个执行HTML解析的python库:

BeautifulSoup是另一种选择。