应用错误收集

如何在特定标签后废弃元素

时间：2018-01-16 08:51:37

标签： python xpath web-scraping scrapy-spider

我有以下html部分

<td>Hadoop Software
  <strong>:</strong> 1.3.2
</td>

我想要废弃1.3.2强标签后出现的文字，如何在scrapy中做到这一点。

我能够立即获取文本以打开td标记，但无法在强标记之后获取文本（这是我正在使用的代码 -

rows = response.xpath('//table[contains(@class, "sortable")]/tbody//tr')
for row in rows:
   columns = row.xpath('td')
        version = columns[0].xpath('text()').extract_first()

这只能让我输出为Hadoop软件

0 个答案:

没有答案