我有这段代码:
<div class="class_one"><a href="link"></a></div>
我这样做:
soup = BeautifulSoup(path.text, 'html.parser')
for link in soup.find_all("div", { "class" : "class_one"}):
我使用正则表达式来获取href链接。还有另一种美溶汤解决方案吗?
答案 0 :(得分:1)
for link in soup.find_all("div", { "class" : "class_one"}):
a = link.next_element
print(a)
出:
<a href="link"></a>
字符串或标记的.next_element属性指向之后立即解析的内容。
答案 1 :(得分:0)
一个(可能效率低下)解决方案是获取a
中的所有div
项并访问其href
:
soup = BeautifulSoup(this, 'html.parser')
for linkdiv in soup.find_all("div", { "class" : "class_one"}):
targets = [link.get('href') for link in linkdiv.find_all('a')]
print(targets[0])