您好我正在通过Python进行数据分析,我想分析他在本书中经历的数据。在第9章中,他使用下面的数据。但是,一旦我将它下载到mac上的github应用程序,我很难理解如何利用ipython笔记本中的数据。
库存数据位于:https://github.com/pydata/pydata-book/blob/master/ch09/stock_px.csv
我点击了“open”,它在我的github应用程序上下载了一个大文件。它看起来像下面。如何在ipython笔记本中打开此数据?
**看看其他stackoverflow问题,我知道我只能下载我正在做的zip文件。知道如何有效地使用github应用程序会很酷。
右键单击并保存csv文件似乎保存了json / html文件
答案 0 :(得分:8)
您应该只能使用原始版本的url
(原始版本的链接是您提供的链接上的按钮),然后使用read_csv
直接将其读入数据框:
import pandas as pd
url = 'https://raw.githubusercontent.com/pydata/pydata-book/master/ch09/stock_px.csv'
df = pd.read_csv(url,index_col=0,parse_dates=[0])
print df.head(5)
AAPL MSFT XOM SPX
2003-01-02 7.40 21.11 29.22 909.03
2003-01-03 7.45 21.14 29.24 908.59
2003-01-06 7.45 21.52 29.96 929.01
2003-01-07 7.43 21.93 28.95 922.93
2003-01-08 7.28 21.31 28.83 909.93
编辑:关于我以前在文件中阅读的选项的简要说明:
df = pd.read_csv(url,index_col=0,parse_dates=[0])
第一列(column = 0)是文件中的一列日期,因为它没有列名,所以它看起来像是索引; index_col=0
使其成为索引,parse_dates [0]告诉read_csv将column = 0(第一列)解析为日期。
答案 1 :(得分:1)
首先将 github csv 文件转换为 raw 以访问数据,请按照以下链接评论如何将 csv 文件转换为 raw。
import pandas as pd
url_data = (r'https://raw.githubusercontent.com/oderofrancis/rona/main/Countries-Continents.csv')
data_csv = pd.read_csv(url_data)
data_csv.head()