我试图用Scrapy提取一段特定的文字。
这是我的代码
item['movie_director'] = movie.xpath(substring-before(substring-after(span[1]/text(), 'Director : '), '.')).extract()
格式为: 导演:导演的名字。
我想只提取这个: 导演的名字
但是当我设置抓取工具时,我遇到了这样的错误:全局名称' substring'没有定义。
我认为包含了子串的使用。有没有办法导入这个?
感谢您的帮助。
答案 0 :(得分:2)
您的xpath
表达式必须是string
,即将其置于引号下:
item['movie_director'] = movie.xpath("substring-before(substring-after(span[1]/text(), 'Director : '), '.')").extract()