Question

我正在使用以下源代码：

import numpy as np
import pandas as pd


# Load data
data = pd.read_csv('C:/Users/user/Desktop/Daily_to_weekly.csv', keep_default_na=True)

print(data.shape[1])
# 18

# Create weekly data
# Agreggate by calculating the sum per store for every week
data_weekly = data.groupby(['STORE_ID', 'WEEK_NUMBER'], as_index=False).agg('sum')

print(data_weekly.shape[1])
# 17

由于某些原因，您可能会看到聚合后缺少列，并且该列都不是GroupBy列（'STORE_ID', 'WEEK_NUMBER'）。

为什么会这样，我该如何解决？

Answer 1

我曾经多次遇到这个问题。问题是熊猫正在删除您的一列，因为它已将其标识为“令人讨厌的”列。这意味着您尝试执行的聚合无法应用于它。如果您希望保留此列，建议将其包括在groupby中。

http://pandas.pydata.org/pandas-docs/stable/groupby.html#automatic-exclusion-of-nuisance-columns

Pandas GroupBy之后缺少列（不是GroupBy列）

1 个答案: