如何在bs4中打破循环

时间:2017-01-25 04:37:22

标签: python breakpoints extraction

我试图用美丽的汤提取一些信息。我想提取一些位于html顶部的信息,一旦找到一个独特的属性来打破或停止查看并继续下一次迭代。

这是我想要提取的信息的代码。

<span class="replies">15</span>

我希望它能够停止查看html源代码。

ln -s /run/media/kennedy/data/Kennedy /home/kennedy

有什么想法吗?

谢谢

1 个答案:

答案 0 :(得分:0)

您需要在脚本中使用if语句并使用breakbreak将停止正在运行的最内层循环。我不知道你真正想做什么,所以我建议一些可能适合你的事情:

for mainbody in soup2.find_all('div',class_="thread_body"):
    a = mainbody.get_text().strip()
    if a == '15':
        main_body.append(a)
        # get out from this for loop
        break