我有这个 csv:
留言 | reported_agents |
---|---|
缺失的状态标志被移除 | host1 |
缺失状态标志被提升 | host1 |
缺失的状态标志被移除 | host2 |
缺失状态标志被提升 | host2 |
缺失状态标志被提升 | host3 |
我需要得到这个
主持人 | 消息总数 | 缺失标志移除 | 缺失的标志升起 |
---|---|---|---|
host1 | 2 | 1 | 1 |
host2 | 2 | 1 | 1 |
host3 | 1 | 0 | 1 |
这就是我所做的,但它没有显示我需要什么。感谢您的帮助
def load_data():
event = pd.read_csv("events.csv")
return event
data = load_data()
def GCmissing(data):
x=data.groupby('hosts')['message'].value_counts()
答案 0 :(得分:3)
使用 pandas.crosstab
然后沿列求和以获得总计:
out_df = pd.crosstab(index = df['reported_agents'], columns = df['message'])
out_df['total_messages'] = out_df.sum(axis = 1)
输出:
reported_agents Missing status flag was raised Missing status flag was removed total_messages
host1 1 1 2
host2 1 1 2
host3 1 0 1