Question

我的数据框df包含几千行和五列：course，student_ID，assignment，teacher_comment，{{1 }}。每行对应唯一的唯一teacher_comment_type;只有大约30种不同的课程和100种不同的作业。

我很容易使用teacher_comment来生成一个新的数据框，我可以看到每个df.groupby(['assignment', 'teacher_comment_type']).count()给定的任务，这对于任何学生来说都是全面的 - 以及给出的评论类型的次数对于某项任务。我现在想在每个teacher_comment_type本地使用计数列，但我很难这样做。

换句话说，现在，我有：

assignment

感谢。

Answer 1

使用value_counts代替

df.groupby('assignment').teacher_comment_type.value_counts()

assignment  teacher_comment_type
Essay 1     punctuation             5
            formatting error        4
            style feedback          2
            ultimate score          1
Project B   style feedback          7
            punctuation             5
            formatting error        3
            ultimate score          1
Name: teacher_comment_type, dtype: int64

pandas数据框中的度假村特定列

1 个答案: