我是第一次使用python进行网络抓取。我在运行代码时遇到问题,返回的只是空白,但不是错误。我只是在课程中执行相同的代码,但对我不起作用
import urllib.request
from bs4 import BeautifulSoup
class Scraper:
def __init__(self, site):
self.site = site
def scrape(self):
r = urllib.request.urlopen(self.site)
html = r.read()
parser = 'html.parser'
sp = BeautifulSoup(html, parser)
for tag in sp.find_all('a'):
url = tag.get('href')
if url is None:
continue
if 'html' in url:
print('\n' + url)
news = "https://news.google.com/"
Scraper(news).scrape()
我在IDLE和pycharm上运行,结果一无所有。我已经添加了所有模块,但我不知道问题出在哪里。也许从我的url打印所有内容并使其行很多,所以无法从我的代码或从桌面返回它。 谁能帮我吗?