Question

您好我正在通过Python进行数据分析，我想分析他在本书中经历的数据。在第9章中，他使用下面的数据。但是，一旦我将它下载到mac上的github应用程序，我很难理解如何利用ipython笔记本中的数据。

库存数据位于：https://github.com/pydata/pydata-book/blob/master/ch09/stock_px.csv

我点击了“open”，它在我的github应用程序上下载了一个大文件。它看起来像下面。如何在ipython笔记本中打开此数据？

**看看其他stackoverflow问题，我知道我只能下载我正在做的zip文件。知道如何有效地使用github应用程序会很酷。

右键单击并保存csv文件似乎保存了json / html文件

enter image description here

Answer 1

您应该只能使用原始版本的url（原始版本的链接是您提供的链接上的按钮），然后使用read_csv直接将其读入数据框：

import pandas as pd
url = 'https://raw.githubusercontent.com/pydata/pydata-book/master/ch09/stock_px.csv'
df = pd.read_csv(url,index_col=0,parse_dates=[0])

print df.head(5)

            AAPL   MSFT    XOM     SPX
2003-01-02  7.40  21.11  29.22  909.03
2003-01-03  7.45  21.14  29.24  908.59
2003-01-06  7.45  21.52  29.96  929.01
2003-01-07  7.43  21.93  28.95  922.93
2003-01-08  7.28  21.31  28.83  909.93

编辑：关于我以前在文件中阅读的选项的简要说明：

df = pd.read_csv(url,index_col=0,parse_dates=[0])

第一列（column = 0）是文件中的一列日期，因为它没有列名，所以它看起来像是索引; index_col=0使其成为索引，parse_dates [0]告诉read_csv将column = 0（第一列）解析为日期。

Answer 2

首先将 github csv 文件转换为 raw 以访问数据，请按照以下链接评论如何将 csv 文件转换为 raw。

import pandas as pd

url_data = (r'https://raw.githubusercontent.com/oderofrancis/rona/main/Countries-Continents.csv')

data_csv = pd.read_csv(url_data)

data_csv.head()

从github python下载和访问数据

2 个答案: