<tr>
<td><span style="white-space:nowrap">Aug 29, 2016 06:05</span></td>
<td><a class="A" title="B" href="C">
<td>....
....
</tr>
我有很多&lt; TD&GT;包含在&lt;中的元素TR&GT; html中的元素我想访问第一个中的每个文本&lt; TD&GT;其中的元素&lt; TR&GT;包裹和 每个单独的href用于第二个&lt; TD&GT;元件。
每个人应该使用2个不同的查询。
char = tree.xpath('//tr/td[2]/@href')
这是我为href查询提出的但不会为我做的工作。
更新
感谢劳达的帮助,我走上正轨
这对我有用
first = tree.xpath('//tr/td/span/text()')
second = tree.xpath('//tr/td[2]/a/@href')
答案 0 :(得分:1)
该文字并非直接在td
中,因为您可以使用以下内容:
//tr/td/span
第二个:
//tr/td/a
或者如果你想要href而不是元素那么:
//tr/td/a/@href
答案 1 :(得分:0)
非常感谢,这使我走向了正确的方向 date = tree.xpath(&#39; // tr / td / span / text()&#39;) hrefs = tree.xpath(&#39; // tr / td [2] / a / @ href&#39;)