从github python下载和访问数据

时间:2014-05-05 03:03:18

标签: python git pandas

您好我正在通过Python进行数据分析,我想分析他在本书中经历的数据。在第9章中,他使用下面的数据。但是,一旦我将它下载到mac上的github应用程序,我很难理解如何利用ipython笔记本中的数据。

库存数据位于:https://github.com/pydata/pydata-book/blob/master/ch09/stock_px.csv

我点击了“open”,它在我的github应用程序上下载了一个大文件。它看起来像下面。如何在ipython笔记本中打开此数据?

**看看其他stackoverflow问题,我知道我只能下载我正在做的zip文件。知道如何有效地使用github应用程序会很酷。

右键单击并保存csv文件似乎保存了json / html文件

enter image description here

2 个答案:

答案 0 :(得分:8)

您应该只能使用原始版本的url(原始版本的链接是您提供的链接上的按钮),然后使用read_csv直接将其读入数据框:

import pandas as pd
url = 'https://raw.githubusercontent.com/pydata/pydata-book/master/ch09/stock_px.csv'
df = pd.read_csv(url,index_col=0,parse_dates=[0])

print df.head(5)

            AAPL   MSFT    XOM     SPX
2003-01-02  7.40  21.11  29.22  909.03
2003-01-03  7.45  21.14  29.24  908.59
2003-01-06  7.45  21.52  29.96  929.01
2003-01-07  7.43  21.93  28.95  922.93
2003-01-08  7.28  21.31  28.83  909.93

编辑:关于我以前在文件中阅读的选项的简要说明:

df = pd.read_csv(url,index_col=0,parse_dates=[0])

第一列(column = 0)是文件中的一列日期,因为它没有列名,所以它看起来像是索引; index_col=0使其成为索引,parse_dates [0]告诉read_csv将column = 0(第一列)解析为日期。

答案 1 :(得分:1)

首先将 github csv 文件转换为 raw 以访问数据,请按照以下链接评论如何将 csv 文件转换为 raw。

import pandas as pd

url_data = (r'https://raw.githubusercontent.com/oderofrancis/rona/main/Countries-Continents.csv')

data_csv = pd.read_csv(url_data)

data_csv.head()