我将熊猫数据框中的某些“对象”列转换为“类别”,以减少内存使用。
dtypes
国家/地区代码:类别
part_number:类别
日期:datetime64 [ns]
df.groupby(['country_code','part_number'], as_index=False).agg({'date':max})
当 country_code 和 part_number 的数据类型是'object'时,此代码就像一个魅力一样工作,而一旦将它们转换为'category',我得到以下信息错误。
ValueError: Length of values does not match length of index
不确定发生了什么以及如何解决