是否可以使用HTMLParser解析URL的HTML?我已经使用它来解析基本的解析器设置来解析.feed函数中写的HTML
from HTMLParser import HTMLParser
class myParser(HTMLParser):
def handle_starttag(self, tag, attrs):
print "Encountered a start tag:", tag
def handle_endtag(self, tag):
print "Encountered an end tag :", tag
def handle_data(self, data):
print "Encountered some data :", data
parser = myParser()
parser.feed('')
我想知道我是否可以通过网站进行此操作,以便解析我要求的任何网站的所有标记。这可能是HTMLParser还是我必须使用像BeautifulSoup这样的东西?
答案 0 :(得分:0)
最好使用BeautifulSoup ...它可以帮助您解决有关HTML的所有问题,最近用它来构建一个完美的网络爬虫!