如何在熊猫中使用API​​端点下载.csv文件

时间:2019-07-06 21:19:50

标签: python pandas socrata soda

我想使用pandas从API端点下载csv文件。我正在使用以下代码:

df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv').

但是,即使数据集更大(约121k行),结果数据框也只有1,000行。如何下载所有行?

我尝试用nrows指定一个大于1000的数字,但得到的结果相同。

1 个答案:

答案 0 :(得分:0)

Socrata typically requires you用于分页设置为1,000行的数据。您可以使用$limit parameter通过增加对其进行修改。 Based on the data set page,这大约是122,000行,因此可以使用限制为130k来全部获取它们:

df=pd.read_csv('https://data.cityofnewyork.us/resource/nu7n-tubp.csv?$limit=130000')

您可能还想探索SodaPy库。