我有一个包含43.462.904百万条记录的数据集。我尝试用两个变量进行分组,然后对第三个变量进行平均。
功能是:df1 = df.groupby(["var1", pd.Grouper(key="var2"freq="MS")]).mean()
以下是退出错误:IndexError: index 43462904 is out of bounds for size 43462904
错误是因为我的数据集很长?具有少量数据功能的功能
答案 0 :(得分:0)
长度为N的数组可以用0 ... N-1索引:
arr = [0,1,2]
arr [0]:0
arr [1]:1
arr [2]:2
len(arr):3
在此示例中,您尝试访问无效的arr [3],因为它是数组中的第N + 1个条目。