Question

我有以下汤

<a href="https://www.abc1.com">
    <h3>ABC1</h3>
</a>
<a href="https://www.abc2.com">
    <h3>ABC2</h3>
</a>
<a href="https://www.abc3.com">
   <h3>ABC3</h3>
</a>

我要从中获取所有href 现在，我正在做

links = soup.find_all('a')

但这显示的是空数组，像这样

[][][]

有谁知道更好的方法吗？

Answer 1

我可以使用以下代码获取href：-

for link in links:
    print(link['href'])

Answer 2

cont =  soup.find_all('a')

link = []
for href in cont:
    print(link.append(href.get('href')))

#o/p
link
['https://www.abc1.com', 'https://www.abc2.com', 'https://www.abc3.com']

仅获取href beautifulsoup

2 个答案: