查找将数据导出到csv的URL

时间:2019-12-06 04:37:22

标签: python html

我正在使用一个名为balloonsavant.com的网站来下载Python中的美国职业棒球大联盟数据。 Baseball Savant提供了一种用户友好的API,可以查询自2008年以来几乎所有美国职棒大联盟游戏中的单个比赛中的数据,并且可以选择将用户的查询结果导出到CSV文件。

以下URL提供了简单查询的结果:

https://baseballsavant.mlb.com/statcast_search?hfPT=&hfAB=&hfBBT=&hfPR=&hfZ=&stadium=&hfBBL=&hfNewZones=&hfGT=R%7C&hfC=&hfSea=2019%7C&hfSit=&player_type=pitcher&hfOuts=&opponent=&pitcher_throws=&batter_stands=&hfSA=&game_date_gt=&game_date_lt=&hfInfield=&team=&position=&hfOutfield=&hfRO=&home_road=&hfFlag=&hfPull=&pitchers_lookup%5B%5D=434378&metric_1=&hfInn=&min_pitches=0&min_results=0&group_by=name&sort_col=pitches&player_event_sort=h_launch_speed&sort_order=desc&min_pas=0#results

我使用的名为 baseball_scraper 的python库可以通过Python查询Baseball Savant数据库。查看源代码,我发现通过从上方修改URL,某人可以自动下载CSV格式的数据。区别在于,将 / csv &type = details&添加到了URL,而删除了 #results 。这是将数据下载为CSV文件的URL(注意:点击此链接应将文件下载到硬盘驱动器):

https://baseballsavant.mlb.com/statcast_search/csv?hfPT=&hfAB=&hfBBT=&hfPR=&hfZ=&stadium=&hfBBL=&hfNewZones=&hfGT=R%7C&hfC=&hfSea=2019%7C&hfSit=&player_type=pitcher&hfOuts=&opponent=&pitcher_throws=&batter_stands=&hfSA=&game_date_gt=&game_date_lt=&hfInfield=&team=&position=&hfOutfield=&hfRO=&home_road=&hfFlag=&hfPull=&pitchers_lookup%5B%5D=434378&metric_1=&hfInn=&min_pitches=0&min_results=0&group_by=name&sort_col=pitches&player_event_sort=h_launch_speed&sort_order=desc&min_pas=0&type=details&

我不熟悉网页设计,希望能够在其他可以将数据导出到CSV文件的网站上复制该技术。但是,查看第一个URL的源代码,我无法理解如何将 / csv &type = details&添加到URL中触发CSV下载。我应该在源代码中寻找一些特定的东西,以告诉我如何自动导出为CSV?

0 个答案:

没有答案