使用python解析HTML页面

时间:2012-10-07 02:46:57

标签: python html-parsing

我想在像这样的网站源代码中解析

If (something="<BODY>"):
 while (something!="</BODY>"):
  if (something="https")   :
    put the word on a list

事情是我不知道解析的方法(我的意思是我阅读源代码的函数)。 我在对象中有源代码,即MyObj

这是最好的方法吗?

2 个答案:

答案 0 :(得分:3)

使用HTML解析库来解析HTML。两个流行的,好的是beautifulsouplxml

答案 1 :(得分:2)

Beautiful Soup是我用过的最好的HTML解析库,请看一下。