Scrapy将文本与粗体结合在一起

时间:2014-05-04 17:46:51

标签: python web-scraping scrapy

使用Scrapy,以下提取仅适用于普通文本。它排除了我试图检索的所有BOLD标签:

hxs.select('//td[@class="Info_Cell"]/text()').extract()

以下内容仅提取BOLD文本,但不包括普通文本。

hxs.select('//td[@class="Info_Cell"]/b/text()').extract()

如何提取Text,normal和Bold标签。

1 个答案:

答案 0 :(得分:3)

通常//将递归提取所有子节点,因此在您的情况下,您需要:

hxs.select('//td[@class="Info_Cell"]//text()').extract()