使用XPath与Walmart.com表

时间:2019-02-01 17:46:42

标签: html xpath web-scraping

我正在尝试从Walmart.com的产品表中选择信息。沃尔玛格式它们的表如下:

<tr>    
<td class="display-name" colspan="1" rowspan="1">Assembled Product Dimensions (L x W x H)</td>
<td colspan="1" rowspan="1">
<div>3.90 x 5.60 x 10.20 Inches</div>
</td>
</tr>

使用此XPATH:

//td[contains(@class, 'display-name') and text ()='Assembled Product Dimensions (L x W x H)'] 

我能够可靠地找到第一个TD,但无法弄清楚如何返回实际的产品尺寸。例如,我希望我的XPath来回报:

3.90 x 5.60 x 10.20 Inches 

代替

Assembled Product Dimensions (L x W x H)

我已经尝试了一些下面的同胞的组合但还没有成功

1 个答案:

答案 0 :(得分:0)

尝试在XPath的末尾添加/../td/div,以使整个表达式看起来像

//td[contains(@class, 'display-name') and text ()='Assembled Product Dimensions (L x W x H)']/../td/div