从所有<li>标记中提取文本包含带有文本SKU的<b>标记

时间:2018-02-19 23:51:15

标签: python selenium xpath web-scraping scrapy

我想从包含文本SKU的所有li标记包含标记中提取文本。

<ul>
<li> 5.875 x 5.875</li>
<li><b>SKU</b>:        1TVN-11</li>
<li>based name</li>
<li>based name1</li>
<li>based name2</li>
</ul>

从上面我想提取文字&#34; 1TVN-11&#34;但有时这个li标签不存在。我现在正在使用XPath:

SKU = root.xpath("./ul/li/b[.='SKU']/following-sibling::text()[1]")

1 个答案:

答案 0 :(得分:1)

如果li并非一直存在,我会怎么做:

'//b[.="SKU"]/following-sibling::text()[1]'

//代表递归表达式