我想在像这样的网站源代码中解析
If (something="<BODY>"):
while (something!="</BODY>"):
if (something="https") :
put the word on a list
事情是我不知道解析的方法(我的意思是我阅读源代码的函数)。
我在对象中有源代码,即MyObj
这是最好的方法吗?
答案 0 :(得分:3)
使用HTML解析库来解析HTML。两个流行的,好的是beautifulsoup和lxml。
答案 1 :(得分:2)
Beautiful Soup是我用过的最好的HTML解析库,请看一下。