我有一个由个人(他们的ID),活动和相应分数组成的数据框。我试图在学生分组和活动类型时得到总分。我可以用以下方法做到这一点:
random
但是,当我通过查看一名典型的学生来检查结果时:
index
我看到为给定的学生列出了一些活动,这些活动在groupby / pivot表中缺失。如何确保最终的groupby / pivot表完整且不丢失任何值?
答案 0 :(得分:1)
问题是分数的 数据类型不一致(并且在那里浮动!)。
其中一些是字符串。在我将所有分数转换成花车后,缺少的活动出现了。
作为一个额外的好处,使数据类型统一,使计算更快!