仅获取href beautifulsoup

时间:2019-10-11 05:11:04

标签: python python-3.x beautifulsoup python-requests

我有以下汤

<a href="https://www.abc1.com">
    <h3>ABC1</h3>
</a>
<a href="https://www.abc2.com">
    <h3>ABC2</h3>
</a>
<a href="https://www.abc3.com">
   <h3>ABC3</h3>
</a>

我要从中获取所有href 现在,我正在做

links = soup.find_all('a')

但这显示的是空数组, 像这样

[][][]

有谁知道更好的方法吗?

2 个答案:

答案 0 :(得分:0)

我可以使用以下代码获取href:-

for link in links:
    print(link['href'])

答案 1 :(得分:0)

cont =  soup.find_all('a')

link = []
for href in cont:
    print(link.append(href.get('href')))

#o/p
link
['https://www.abc1.com', 'https://www.abc2.com', 'https://www.abc3.com']