我正在使用以下源代码:
import numpy as np
import pandas as pd
# Load data
data = pd.read_csv('C:/Users/user/Desktop/Daily_to_weekly.csv', keep_default_na=True)
print(data.shape[1])
# 18
# Create weekly data
# Agreggate by calculating the sum per store for every week
data_weekly = data.groupby(['STORE_ID', 'WEEK_NUMBER'], as_index=False).agg('sum')
print(data_weekly.shape[1])
# 17
由于某些原因,您可能会看到聚合后缺少列,并且该列都不是GroupBy列('STORE_ID', 'WEEK_NUMBER'
)。
为什么会这样,我该如何解决?
答案 0 :(得分:1)
我曾经多次遇到这个问题。问题是熊猫正在删除您的一列,因为它已将其标识为“令人讨厌的”列。这意味着您尝试执行的聚合无法应用于它。如果您希望保留此列,建议将其包括在groupby中。
http://pandas.pydata.org/pandas-docs/stable/groupby.html#automatic-exclusion-of-nuisance-columns