Question

我有这段代码：

<div class="class_one"><a href="link"></a></div>

我这样做：

soup = BeautifulSoup(path.text, 'html.parser')
for link in soup.find_all("div", { "class" : "class_one"}):

我使用正则表达式来获取href链接。还有另一种美溶汤解决方案吗？

Answer 1

for link in soup.find_all("div", { "class" : "class_one"}):
    a = link.next_element
    print(a)

出：

<a href="link"></a>

字符串或标记的.next_element属性指向之后立即解析的内容。

Answer 2

一个（可能效率低下）解决方案是获取a中的所有div项并访问其href：

soup = BeautifulSoup(this, 'html.parser')
for linkdiv in soup.find_all("div", { "class" : "class_one"}):
    targets = [link.get('href') for link in linkdiv.find_all('a')]
    print(targets[0])

如何在python上获得子链接

2 个答案: