我正在使用Scrapy抓取一个以字符串格式返回json类型文件的网站。
当我使用下面的选择器时,我将按预期在列表中获取完整的数据。
response.xpath('//p/text()').extract()
此列表中的数据是一个类似于json的字符串,我需要将其转换为我正在使用json.loads()
的字典
但是当我使用以下选择器获取列表中存在的json之类的字符串时,就会发生问题。
response.xpath('//p/text()').extract_first()
这会给出部分截断的字符串as并输出,因此json.loads()
给出了Unterminated string的错误。
注意:我尝试了类似的选择器,例如.extract()[0], getall()[0]
等,都遇到了相同的问题。
同样,在打印时,它会打印出截断的部分字符串。