我在python中使用bs4来解析网页并获取信息。我很难抓住标题。我努力的另一个部分是关注链接,如果这是递归完成的,还是我能够通过循环完成?
def getTitle(link):
resp = urllib.request.urlopen(link)
soup = BeautifulSoup(resp, 'html.parser')
print(soup.find("<title>"))
答案 0 :(得分:0)
from bs4 import BeautifulSoup
import urllib
def getTitle(link):
resp = urllib.request.urlopen(link)
soup = BeautifulSoup(resp, 'html.parser')
return soup.title.text
print(getTitle('http://www.bbc.co.uk/news'))
显示:
Home - BBC News