我有一些scrapy代码,可以在某些页面中搜索嵌入式YouTube视频。
item['video'] = response.xpath['//div[@class="imobile-body"]/iframe').extract()
然而,当我输出到xml时,"视频"标签还包含"值"标签以及抓取的数据。
我不想在那里使用价值标签,是否有办法不将其与搜索数据包括在一起?
我知道extract()[0]
有效,但有时会有多个视频被删除,我不想要其他视频。
我该如何纠正?
我也是新手python程序员。
答案 0 :(得分:0)
我自己解决了''.join(response.xpath ['// div [@ class =“imobile-body”] / iframe')。extract())