我不知道如何解析多个html中的电话号码,因为它们在 span class 中具有不同的名称。我只有一个主意,它是解析完整的html文本并使用正则表达式获取电话号码,但是我大约有1000多个html,并且我认为这将花费很多时间
我知道如何使用BeautifulSoup解析单个html页面
r = requests.get(Base_URL)
soup = BeautifulSoup(r.content)
print soup.find("div", class_="some_class").find("span", class_="phone number").text