如何从python解析html文件?

时间:2012-11-05 11:36:26

标签: python

  

可能重复:
  Parsing HTML in Python

我是python的新手,我正在使用python.i从我的网站下载了HTML文件。下载的HTML文件有一些网址。我希望只有一些来自该HTML文件的URL使用python写入单独的文本文件。我可以这样做吗?有谁可以帮助我?

1 个答案:

答案 0 :(得分:3)

使用Beautiful Soup

  

Beautiful Soup是一个Python库,用于从HTML和XML文件中提取数据。它适用于您最喜欢的解析器,以提供导航,搜索和修改解析树的惯用方法。它通常可以节省程序员数小时或数天的工作量。