我是Python的初学者,我学习了一本教科书来学习Pandas模块。 我有一个名为Berri_bike的数据框,它来自以下代码:
bike_df=pd.read_csv(os.path.join(path,'comptagevelo2012.csv'),parse_dates=['Date'],\
encoding='latin1',dayfirst=True,index_col='Date')
Berri_bike=bike_df['Berri1'].copy() # get only the column='Berri1'
Berri_bike['Weekday']=Berri_bike.index.weekday
weekday_counts = Berri_bike.groupby('Weekday').aggregate(sum)
weekday_counts
我的Berri_bilk中有3列,数据索引 - 从2012年1月1日到12月31日,数据列包含每个数据的数字,以及我分配给它的工作日列。但是当我想按值分组时,我得到了错误:ValueError:Grouper和axis的长度必须相同,我不确定这是什么意思,我想做的很简单,比如SQL,sum(value)工作日分组...有谁可以让我知道这里发生了什么?
答案 0 :(得分:4)
您将列复制到pandas系列而不是新数据帧,因此执行以下操作behave differently。如果您打印Berri_bike
,则可以看到此信息,因为它没有显示列名称
相反,您应该copy the column into a new dataframe:
import pandas as pd
df = pd.DataFrame(np.random.randint(0, 30, size = (70, 2)),
columns = ["A", "B"],
index = pd.date_range("20180101", periods = 70))
Berri_bike = df[["A"]]
Berri_bike['Weekday'] = Berri_bike.index.weekday
weekday_counts = Berri_bike.groupby("Weekday").sum()
print(weekday_counts)
#sample output
A
Weekday
0 148
1 101
2 127
3 139
4 163
5 74
6 135