数据懒惰beautifulsoup html找到

时间:2016-10-09 04:55:26

标签: beautifulsoup

我在beautifulsoup中调用特定属性时遇到问题

<div class="route_list "
data-id="11234" 
data-lazy="ubt" 
data-ubt-company="ABC" 
data-ubt-departuredate="2016-11-10" 
data-ubt-destcountry="China," 
data-ubt-from="Shanghai" 
data-ubt-mark="Bus" 
data-ubt-price="2399" 
data-ubt-sailingid="11185" 
data-ubt-score="4.4" 
data-ubt-sourcefrom="Cruise" 
data-ubt-voyaid="1184">

我试图仅提取公司和出发日期,以下代码返回一个关键错误。

bsObj = BeautifulSoup(html.read(), "html.parser") 
div=bsObj.div
departure = div.attrs['data-ubt-departuredate']

1 个答案:

答案 0 :(得分:0)

您可能无法定位所需的div缩小搜索范围

div = bsObj.find("div", class_="route_list")

或者,检查是否存在data-ubt-departuredate属性:

div = bsObj.find("div", {"data-ubt-departuredate": True})