Question

我在python中使用bs4来解析网页并获取信息。我很难抓住标题。我努力的另一个部分是关注链接，如果这是递归完成的，还是我能够通过循环完成？

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    print(soup.find("<title>"))

Answer 1

from bs4 import BeautifulSoup    
import urllib    

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    return soup.title.text

print(getTitle('http://www.bbc.co.uk/news'))

显示：

Home - BBC News

如何使用Python中的Beautiful Soup从网页中获取标题并进行迭代

1 个答案: