我正在尝试通过XPATH从Google那里获取一些数据,并且它们具有链接, 奇怪的结构,类似于A标签内部,它们也具有H3,DIV和CITE标签。
我正在尝试获取H3值,但我没有正确。 到目前为止,我正在使用什么:
// div [@ class =“ r”] // a / h3 [@ class =“ LC20lb”] / text()
因此,在div中,有一个A标签,并且该A标签的内部带有特定类的H3。
编辑:来自Google的代码
<div class="r">
<a href="https://www.tutorialspoint.com/tutorialslibrary.htm" ping="/url?sa=t&source=web&rct=j&url=https://www.tutorialspoint.com/tutorialslibrary.htm&ved=2ahUKEwi-2uL3k8DiAhVDLFAKHZ_NAJMQFjAAegQIABAB">
<h3 class="LC20lb">Free Online Tutorials and Courses - Tutorialspoint</h3>
<br>
<div class="TbwUpd">
<cite class="iUh30">https://www.tutorialspoint.com/tutorialslibrary.htm</cite>
</div>
</a>
</div>