我有一个拥有大量NA的DataFrame。 pandas的groupby操作忽略了NA中的任何组合。有没有办法在组中包含NA?如果没有,pandas groupby的替代品是什么?我真的不想填写新闻,因为缺少某些东西是有用的信息。
修改:我发现我的问题与groupby columns with NaN (missing) values中报告的问题完全相同 是否有任何开发技术可以解决这个问题?
答案 0 :(得分:1)
我将仅对groupby使用某种非NA表示形式的NA,这不能与正确的数据混淆(例如-999999或'缺少')
df.fillna(-999999).groupby(...)
由于inplace
参数的默认值为False
,因此您的原始数据框不会受到影响。