我有以下html部分
<td>Hadoop Software
<strong>:</strong> 1.3.2
</td>
我想要废弃1.3.2强标签后出现的文字,如何在scrapy中做到这一点。
我能够立即获取文本以打开td标记,但无法在强标记之后获取文本(这是我正在使用的代码 -
rows = response.xpath('//table[contains(@class, "sortable")]/tbody//tr')
for row in rows:
columns = row.xpath('td')
version = columns[0].xpath('text()').extract_first()
这只能让我输出为Hadoop软件