在BS4中搜索文本

时间:2018-05-07 09:31:55

标签: python regex beautifulsoup

假设我们有:

<div>Hello, My no is 8493081876</div>

如何通过在BS4中查找正则表达式(用于电话号码)来选择“div”?

2 个答案:

答案 0 :(得分:1)

离开bs4 documentation

您可以使用find_all函数使用字符串参数搜索字符串。

soup.find_all("div",string="8493081876")

您还可以在for string中传递正则表达式。

soup.find_all("div",string=re.compile("1876")

答案 1 :(得分:0)

使用soup.find_all,例如我将此文本添加到文件名bs4.txt

from bs4 import BeautifulSoup

f = open('bs4.txt', 'r')
soup = BeautifulSoup(f, 'html.parser')
for find in soup.find_all('div'):
  print(find)