如何使用CSS选择器访问BeautifulSoup中的嵌套HTMLelement

时间:2018-03-10 19:12:45

标签: python web-scraping beautifulsoup

HTML是:

<span class="_hylizj6">
  <span class="_1m8bb6v">
    <span>Cena</span>
  </span>
  <span>233 zł</span>
</span>

使用BeautifulSoup和CSS选择器,如何访问“233zł”?

我试过了:

airbnb_soup.select('.hylizj6 span span')

但是没有去,即使

airbnb_soup.select('.hylizj6 span')

将获得“Cena”

3 个答案:

答案 0 :(得分:0)

基本上你做了什么(除了在'hylizj6'之前放置一个下划线),然后要求紧跟在那之后的第二个跨度。

javascript:void(0)

答案 1 :(得分:0)

有几种方法。如果HTML 总是相同,则可以使用

{{1}}

答案 2 :(得分:0)

由于BeautifulSoap select()方法返回一个列表,您需要使用Index访问它,在本例中为[0]。请参阅Selecting nested element with beautiful soup作为参考。 此外,您还可以考虑find()或find_all()方法,具体取决于您需要解决的任务类型。