Scrapy Xpath查询(从类似类中删除但不同的对齐标记)

时间:2014-02-26 07:37:51

标签: xpath scrapy

我想要抓取数据的代码:

<td class="pageHeading" valign="top">ABC<br><span class="smallText">[RK103401]</span></td>
            <td class="pageHeading" align="right" valign="top">SAMPLE2<br>

我想知道将导致我提取SAMPLE2的Xpath。

我注意到班级名称是相同的,但无法弄清楚如何解决这个问题。

谢谢!

1 个答案:

答案 0 :(得分:0)

在查找XPath以选择特定的内容时,您希望找到一个您想要捕获的元素。在这里,很难说因为HTML不多,所以我们不知道哪些元素不会在整个文档中重复。

这样的事情可能会起到作用:

//td[class="pageHeading" and align="right"]/text()