我有以下html代码,我想通过使用css选择器的xpath从最后一个标签中提取文本“Extracted Text”。第二个标签内的文本“值”将始终在变化,我们已将该值存储在某个变量中。所以我想编写一个代码,它将在html下解析并提取文本。
<div>
<div>value</div>
<div class="a">
<div>
<div>Extracted Text</div>
</div>
</div>
</div>
我尝试使用以下代码:
response.xpath('//div[div="variable"]//div/div/text()')
但它不起作用。请帮忙。
答案 0 :(得分:1)
这个xpath做你想要的
'//div[text()="value"]/following-sibling::div/div/div/text()'
在命令行上测试
xmllint --html --xpath '//div[text()="value"]/following-sibling::div/div/div/text()' test.html
Extracted Text