Pandas GroupBy之后缺少列(不是GroupBy列)

时间:2019-01-22 18:16:00

标签: python pandas pandas-groupby

我正在使用以下源代码:

import numpy as np
import pandas as pd


# Load data
data = pd.read_csv('C:/Users/user/Desktop/Daily_to_weekly.csv', keep_default_na=True)

print(data.shape[1])
# 18

# Create weekly data
# Agreggate by calculating the sum per store for every week
data_weekly = data.groupby(['STORE_ID', 'WEEK_NUMBER'], as_index=False).agg('sum')

print(data_weekly.shape[1])
# 17 

由于某些原因,您可能会看到聚合后缺少列,并且该列都不是GroupBy列('STORE_ID', 'WEEK_NUMBER')。

为什么会这样,我该如何解决?

1 个答案:

答案 0 :(得分:1)

我曾经多次遇到这个问题。问题是熊猫正在删除您的一列,因为它已将其标识为“令人讨厌的”列。这意味着您尝试执行的聚合无法应用于它。如果您希望保留此列,建议将其包括在groupby中。

http://pandas.pydata.org/pandas-docs/stable/groupby.html#automatic-exclusion-of-nuisance-columns