from bs4 import BeautifulSoup
import re
# import urllib2
url = "./page1.html"
page = open(url)
soup = BeautifulSoup(page.read(), features="html.parser")
divs = soup.find_all('div',class_='ColorMeasuresAndOthers')
for div in divs:
print (div)
我尝试了不同的方法:
find_all('div')
find_all('div', {'class':'ColorMeasuresAndOthers'})
唯一起作用的是返回一个div的find_all('div'),其余的则不返回任何内容。
该文档有504个div,如果我尝试找到其他元素(例如锚标签),它将全部找到。
html代码:like here