我想在html属性中提取json数据。这是我的xpah:到目前为止我得到了null。链接为https://wefunder.com/beta.bionics
response.xpath('//*[@id="sb-site"]/div/div[4]/*[name()="wf:loader"]/@company-json').extract()
以下是该网页的屏幕截图:
提前致谢!
答案 0 :(得分:0)
您根本不需要在此处指定标记名称 - 只需获取具有company-json
属性的元素即可。使用Scrapy进行演示(我认识了语法):
$ scrapy shell https://wefunder.com/beta.bionics
>>> response.xpath("//*[@company-json]/@company-json").extract_first()
u'{"company":{"id":9512,"url":"beta...
...rait_photo_url":false}}'