我想从这里获取一些数据:
我正在搜索车主的ID。该ID位于类a
的{{1}}属性中。对于上面的页面,它是car_owner_section
属性中的数字,例如“ / users / 1228276”。问题是此链接显然是由javascript呈现的,我绝对希望避免刮擦。有谁知道如何找到此ID?我猜它应该在JSON上的某个位置,但是我已经搜索了几天,却一无所获。
答案 0 :(得分:1)
我在scrapy shell上对其进行了测试,并且响应返回了您正在寻找的链接,而没有使用启动。您可能要检查您的设置。
USER_AGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:39.0) Gecko/20100101 Firefox/39.0'
# Obey robots.txt rules
ROBOTSTXT_OBEY = False