如何在python上获得子链接

时间:2016-12-08 17:33:03

标签: python html beautifulsoup

我有这段代码:

<div class="class_one"><a href="link"></a></div>

我这样做:

soup = BeautifulSoup(path.text, 'html.parser')
for link in soup.find_all("div", { "class" : "class_one"}):

我使用正则表达式来获取href链接。还有另一种美溶汤解决方案吗?

2 个答案:

答案 0 :(得分:1)

for link in soup.find_all("div", { "class" : "class_one"}):
    a = link.next_element
    print(a)

出:

<a href="link"></a>

字符串或标记的.next_element属性指向之后立即解析的内容。

答案 1 :(得分:0)

一个(可能效率低下)解决方案是获取a中的所有div项并访问其href

soup = BeautifulSoup(this, 'html.parser')
for linkdiv in soup.find_all("div", { "class" : "class_one"}):
    targets = [link.get('href') for link in linkdiv.find_all('a')]
    print(targets[0])