我想要抓取数据的代码:
<td class="pageHeading" valign="top">ABC<br><span class="smallText">[RK103401]</span></td>
<td class="pageHeading" align="right" valign="top">SAMPLE2<br>
我想知道将导致我提取SAMPLE2的Xpath。
我注意到班级名称是相同的,但无法弄清楚如何解决这个问题。
谢谢!
答案 0 :(得分:0)
在查找XPath以选择特定的内容时,您希望找到一个您想要捕获的元素。在这里,很难说因为HTML不多,所以我们不知道哪些元素不会在整个文档中重复。
这样的事情可能会起到作用:
//td[class="pageHeading" and align="right"]/text()