Question

是否可以使用HTMLParser解析URL的HTML？我已经使用它来解析基本的解析器设置来解析.feed函数中写的HTML

from HTMLParser import HTMLParser

class myParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        print "Encountered a start tag:", tag
    def handle_endtag(self, tag):
        print "Encountered an end tag :", tag
    def handle_data(self, data):
        print "Encountered some data  :", data

parser = myParser()
parser.feed('')

我想知道我是否可以通过网站进行此操作，以便解析我要求的任何网站的所有标记。这可能是HTMLParser还是我必须使用像BeautifulSoup这样的东西？

Answer 1

最好使用BeautifulSoup ...它可以帮助您解决有关HTML的所有问题，最近用它来构建一个完美的网络爬虫！

使用HTMLParser解析URL

1 个答案: