熊猫数据框熊猫

时间:2021-07-10 16:26:20

标签: python pandas dataframe

我有这个 csv:

<头>
留言 reported_agents
缺失的状态标志被移除 host1
缺失状态标志被提升 host1
缺失的状态标志被移除 host2
缺失状态标志被提升 host2
缺失状态标志被提升 host3

我需要得到这个

<头>
主持人 消息总数 缺失标志移除 缺失的标志升起
host1 2 1 1
host2 2 1 1
host3 1 0 1

这就是我所做的,但它没有显示我需要什么。感谢您的帮助

def load_data():
    event = pd.read_csv("events.csv")
    return event
data = load_data()

def GCmissing(data):
        x=data.groupby('hosts')['message'].value_counts()         

1 个答案:

答案 0 :(得分:3)

使用 pandas.crosstab 然后沿列求和以获得总计:

out_df = pd.crosstab(index = df['reported_agents'], columns = df['message'])
out_df['total_messages'] = out_df.sum(axis = 1)

输出:

reported_agents Missing status flag was raised  Missing status flag was removed total_messages
host1           1                               1                               2
host2           1                               1                               2
host3           1                               0                               1