我试图用scrapy抓取一些NBA数据,但我无法弄清楚如何从动态生成的表中获取数据。
例如,我无法通过xpaths访问此处http://stats.nba.com/game/0041700404/表格中的数据。我需要在一个似乎是动态加载的表上的数据,我无法弄清楚如何在http://stats.nba.com/stats/boxscoresummaryv2?GameID=0041700404中获取具有json格式所需数据的数据。
我尝试连接到网站并打印json:
import scrapy
import json
class DataSpider(scrapy.Spider):
name = "test2"
start_urls = [
'http://stats.nba.com/stats/boxscoresummaryv2?GameID=0041700404',
]
def parse(self, response):
print(json.loads(response.body))