我有2个熊猫数据框。每个都有一个维度和一个指标。我需要基于每个表中的维度来汇总指标,并根据维度将它们加入。 所以:
A
dim1 met1
a 100
a 200
b 50
B
dim2 met2
a 70
a 20
c 50
我在每个数据帧上使用pandas.groupby(),但是当我通过执行.dtypes检查groupby的结果时,我发现在聚合输出中不再存在dim1 dim2。
所以现在,当我尝试基于dim1 = dim2加入时,我收到消息dim1,dim2不存在。
我做错了什么?
答案 0 :(得分:1)
pandas groupby API的默认行为是使石斑鱼成为输出中的索引。
您可以通过在分组时指定as_index=False
来规避此问题。有关更多信息,请参见docs。
as_index
:boolean
,默认True
对于聚合输出,返回带有组标签的对象作为索引。 仅与
DataFrame
输入有关。as_index=False
有效 “ SQL风格”分组输出
不适用于对系列进行分组。