Question

问题：- 我想只使用一行代码获取网页中的所有 h3 标签。

我知道如何使用beautifulsoup 获取标签及其innerHTML，但一次只能获取一个。这是基本代码：-

from bs4 import BeautifulSoup
import requests

source = requests.get("https://en.wikipedia.org/wiki/Code").text

soup = BeautifulSoup(source, 'lxml')

content = soup.find("span")
spans = content
print(spans)

输出：

<块引用>

...

如上所示，它只返回一个跨度，当我需要所有跨度显示为输出时，有点像：
...,... 请指导我这样做

Answer 1

试试这个

import bs4
soup1 = bs4.BeautifulSoup(htm1, 'html.parser')
for match in soup1.findAll('span'):
    match.unwrap()
print soup1

如何使用beautifulsoup4抓取网站中的所有h3标签

1 个答案: