Python 3 Web刮板非常简单,无法正常工作

时间:2018-09-09 22:34:30

标签: python beautifulsoup urllib

我正在读一本“自学成才的程序员”书,遇到了一些python代码的麻烦。我让程序运行无任何错误。问题在于根本没有输出。

docker commit 9c09acd48a25 fedora-base-with-git

1 个答案:

答案 0 :(得分:3)

查看最后一个“ if”语句。如果网址中没有文本“ html”,则不会打印任何内容。尝试删除它并取消缩进:

class Scraper:
    def __init__(self, site):
        self.site = site

    def scrape(self):
        r = urllib.request\
            .urlopen(self.site)
        html = r.read()
        parser = "html.parser"
        sp = BeautifulSoup(html, parser)
        for tag in sp.find_all("a"):
            url = tag.get("href")
            if url is None:
                continue
            print("\n" + url)