通过提取和分组熊猫列来汇总数据框

时间:2019-01-21 18:36:22

标签: python pandas dataframe

我想总结一个csv文件中的列。几乎提取了列数据并将其与相关的评分和计数进行匹配。

此外,您知道如何将预期的数据框与网站图片进行匹配吗?

    website   rate
1   two     5
2   two     3
3   two     5
4   one     2
5   one     4
6   one     4
7   one     2
8   one     2
9   two     2

website  rate(over 5)  count     appeal(rate over 5 / count >= 0.5)
one      0             5         0 
two      2             4         1

1 个答案:

答案 0 :(得分:1)

您可以使用groupby操作:

res = df.assign(rate_over_5=df['rate'].ge(5))\
        .groupby('website').agg({'rate_over_5': ['sum', 'size']})\
        .xs('rate_over_5', axis=1).reset_index()

res['appeal'] = ((res['sum'] / res['size']) >= 0.5).astype(int)

print(res)

  website  sum  size  appeal
0     one  0.0     5       0
1     two  2.0     4       1