Scrapy 1.0.3使用xpath和extract()获取<value>标记的数据

时间:2015-09-08 02:18:58

标签: python xml xpath web-scraping scrapy

我有一些scrapy代码,可以在某些页面中搜索嵌入式YouTube视频。

实施例

item['video'] = response.xpath['//div[@class="imobile-body"]/iframe').extract()

然而,当我输出到xml时,&#34;视频&#34;标签还包含&#34;值&#34;标签以及抓取的数据。

我不想在那里使用价值标签,是否有办法不将其与搜索数据包括在一起?

我知道extract()[0]有效,但有时会有多个视频被删除,我不想要其他视频。

我该如何纠正?

我也是新手python程序员。

1 个答案:

答案 0 :(得分:0)

我自己解决了''.join(response.xpath ['// div [@ class =“imobile-body”] / iframe')。extract())