将html转换为纯文本Python

时间:2020-07-18 06:08:50

标签: python html plaintext

早上好,我正在寻找一种将html代码转换为纯文本的方法,我举个例子

HTML

<div class="card-headline"><h3 class="card-title">

Texto Plano

&lt;div class=&quot;card-headline&quot;&gt;&lt;h3 class=&quot;card-title&quot;&gt;

1 个答案:

答案 0 :(得分:0)

BeautifulSoup是一个抓取库,因此它可能不是进行HTML渲染的最佳选择。如果不是必须使用BeautifulSoup,则应查看html2text。例如:

  • 导入html2text
  • html = open(“ foobar.html”)。read()
  • 打印html2text.html2text(html)

这将输出:

一些文本更多文本甚至更多文本

  • 列表项
  • 还有另一个列表项

其他一些文字

  • 列表项
  • 还有另一个列表项