我正在尝试将Google电子表格中的数据导入pandas
进行分析。我在一个工作表中有几个数据集,因此我无法将导入用作此处显示的CSV示例:Getting Google Spreadsheet CSV into A Pandas Dataframe
这就是我的数据在电子表格中的样子:
Date letters numbers mixed
1/1/2014 a 3 z1
1/2/2014 b 2 y2
1/3/2014 c 1 x3
我已经使用gspread
进行导入,并且可以使每行观察到数据:
[['Date', 'letters', 'numbers', 'mixed'], ['1/1/2014', 'a', '3', 'z1'], ['1/2/2014', 'b', '2', 'y2'], ['1/3/2014', 'c', '1', 'x3']]
我的问题是如何将它带入带有数字索引的pandas数据帧?我不希望日期成为索引。我需要一个通用的解决方案,我的数据集是1000行乘50列。
答案 0 :(得分:2)
这是我要做的事情
import pandas as pd
d=[['Date', 'letters', 'numbers', 'mixed'],\
['1/1/2014', 'a', '3', 'z1'],\
['1/2/2014', 'b', '2', 'y2'],\
['1/3/2014', 'c', '1', 'x3']]
df = pd.DataFrame.from_records(d[1:],columns=d[0])
df.set_index('numbers')
结果如下
Date letters mixed
numbers
3 1/1/2014 a z1
2 1/2/2014 b y2
1 1/3/2014 c x3
答案 1 :(得分:0)
对于任何想要将pandas
数据框与Google表格联系起来的人,请不要再犹豫了! gspread-dataframe
就在这里。它提供了gspread
和pandas
之间缺少的链接。
使用pip install gspread-dataframe
安装。
答案 2 :(得分:0)
将谷歌电子表格转移到python pandas的另一种方法是使用df2gspread: http://df2gspread.readthedocs.io/en/latest/overview.html#usage1
设置只需要3行代码就可以完成这个操作:
from df2gspread import gspread2df as g2d
df = g2d.download(gfile="your_spreadsheet_ID", col_names=True, row_names=True)
我只是设置了这个,所以如果您有任何问题,请随时提出。