标签: python html
我想知道如何使用python从给定网站中删除HTML标记。我希望能够输出html页面中的所有文本,不包括所有HTML代码
答案 0 :(得分:0)
试试Beautiful Soup。然后,您可以通过以下方式获取所有剥离的文本:
soup.get_text()