将Google电子表格数据转换为pandas数据框

时间:2014-05-22 10:45:11

标签: python pandas dataframe

我正在尝试将Google电子表格中的数据导入pandas进行分析。我在一个工作表中有几个数据集,因此我无法将导入用作此处显示的CSV示例:Getting Google Spreadsheet CSV into A Pandas Dataframe

这就是我的数据在电子表格中的样子:

Date     letters    numbers    mixed
1/1/2014   a            3        z1
1/2/2014   b            2        y2
1/3/2014   c            1        x3

我已经使用gspread进行导入,并且可以使每行观察到数据:

[['Date', 'letters', 'numbers', 'mixed'], ['1/1/2014', 'a', '3', 'z1'], ['1/2/2014', 'b', '2', 'y2'], ['1/3/2014', 'c', '1', 'x3']]

我的问题是如何将它带入带有数字索引的pandas数据帧?我不希望日期成为索引。我需要一个通用的解决方案,我的数据集是1000行乘50列。

3 个答案:

答案 0 :(得分:2)

这是我要做的事情

import pandas as pd
d=[['Date', 'letters', 'numbers', 'mixed'],\
   ['1/1/2014', 'a', '3', 'z1'],\
   ['1/2/2014', 'b', '2', 'y2'],\
   ['1/3/2014', 'c', '1', 'x3']]
df = pd.DataFrame.from_records(d[1:],columns=d[0])
df.set_index('numbers')

结果如下

             Date letters mixed
numbers
3        1/1/2014       a    z1
2        1/2/2014       b    y2
1        1/3/2014       c    x3

答案 1 :(得分:0)

对于任何想要将pandas数据框与Google表格联系起来的人,请不要再犹豫了! gspread-dataframe就在这里。它提供了gspreadpandas之间缺少的链接。

使用pip install gspread-dataframe安装。

答案 2 :(得分:0)

将谷歌电子表格转移到python pandas的另一种方法是使用df2gspread: http://df2gspread.readthedocs.io/en/latest/overview.html#usage1

设置只需要3行代码就可以完成这个操作:

from df2gspread import gspread2df as g2d
df = g2d.download(gfile="your_spreadsheet_ID", col_names=True, row_names=True)

我只是设置了这个,所以如果您有任何问题,请随时提出。