使用Scrapy,以下提取仅适用于普通文本。它排除了我试图检索的所有BOLD标签:
hxs.select('//td[@class="Info_Cell"]/text()').extract()
以下内容仅提取BOLD文本,但不包括普通文本。
hxs.select('//td[@class="Info_Cell"]/b/text()').extract()
如何提取Text,normal和Bold标签。
答案 0 :(得分:3)
通常//
将递归提取所有子节点,因此在您的情况下,您需要:
hxs.select('//td[@class="Info_Cell"]//text()').extract()