Question

我想在html属性中提取json数据。这是我的xpah：到目前为止我得到了null。链接为https://wefunder.com/beta.bionics

response.xpath('//*[@id="sb-site"]/div/div[4]/*[name()="wf:loader"]/@company-json').extract()

以下是该网页的屏幕截图：

提前致谢！

Answer 1

您根本不需要在此处指定标记名称 - 只需获取具有company-json属性的元素即可。使用Scrapy进行演示（我认识了语法）：

$ scrapy shell https://wefunder.com/beta.bionics >>> response.xpath("//*[@company-json]/@company-json").extract_first() u'{"company":{"id":9512,"url":"beta... ...rait_photo_url":false}}'

如何在Xpath中提取json属性？

1 个答案: