如何使用Python中的Beautiful Soup从网页中获取标题并进行迭代

时间:2018-04-26 17:41:45

标签: python beautifulsoup

我在python中使用bs4来解析网页并获取信息。我很难抓住标题。我努力的另一个部分是关注链接,如果这是递归完成的,还是我能够通过循环完成?

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    print(soup.find("<title>"))

1 个答案:

答案 0 :(得分:0)

from bs4 import BeautifulSoup    
import urllib    

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    return soup.title.text

print(getTitle('http://www.bbc.co.uk/news'))

显示:

Home - BBC News