Question

我希望得到所有与文本匹配的祖先div标签。例如，如果html看起来像HTML snippet

我正在寻找Earl E. Byrd＆＃34;。我想得到一个包含{＆＃34;买家信息＆＃34;，＆＃34;买家名称＆＃34;}

的列表

这就是我做的

r=requests.get(self.url,verify='/path/to/certfile')
                soup = BeautifulSoup(r.text,"lxml")
                divTags = soup.find_all('div')

我该怎么办？

Answer 1

使用xpath表达式的解决方案：

//div[@title="buyer-info"]/div[text() = "Carlson Busses"]/ancestor::div

Answer 2

如果要按文本搜索div并获取所有以前具有 title 属性的div，请先使用文本查找div，然后使用find_all_previous setting {{1 }}

title=True

使用python在HTML中查找CSS路径（祖先标记）

2 个答案: