我不确定100%哪个堆栈线程溢出来发布此问题,只是选择了该线程来发布问题。
我一直在尝试几个小时,只是为了简单地下载数据集,这令人沮丧。因此,我决定向经验丰富的用户寻求帮助。
问题是这样的:
如何使用python(网络抓取)或R或bash wget或仅单击菜单或任何其他工具从运输统计局按照以下条件下载数据:
我查看了BTS(https://www.bts.gov/)网站,对于我而言,以给定的标准下载数据实在令人难以承受。
非常感谢帮助,说明或快照。
答案 0 :(得分:2)
这可以帮助您迈出第一步-但是:https://www.transtats.bts.gov/ONTIME/Departures.aspx。 还有:https://www.flightstats.com/(我只听说过此消息,没有进行任何挖掘。主页上的下拉菜单中有一个历史和数据导出选项)
“所有统计信息” -然后选择纽约市的机场,如果所有3个机场都可能要遍历这些机场- --carrier:这是一个庞大的清单,不确定是否需要“每次”飞行,但我从EWR中选择了UA-- “所有月份” '每天' '2018'
最大