使用python在HTML中查找CSS路径(祖先标记)

时间:2016-09-21 21:35:14

标签: python web-scraping bs4

我希望得到所有与文本匹配的祖先div标签。例如,如果html看起来像HTML snippet

我正在寻找Earl E. Byrd"。我想得到一个包含{"买家信息","买家名称"}

的列表

这就是我做的

r=requests.get(self.url,verify='/path/to/certfile')
                soup = BeautifulSoup(r.text,"lxml")
                divTags = soup.find_all('div')

我该怎么办?

2 个答案:

答案 0 :(得分:0)

使用表达式的解决方案:

//div[@title="buyer-info"]/div[text() = "Carlson Busses"]/ancestor::div

答案 1 :(得分:0)

如果要按文本搜索div并获取所有以前具有 title 属性的div,请先使用文本查找div,然后使用find_all_previous setting {{1 }}

title=True