我的数据集是这样的
id viewcount title answercount tags first_tag
1 78 ** 2 ** python
2 87 ** 1 ** pandas
3 87 ** 1 ** pandas
4 83 ** 0 ** Excel
现在我想获取每个标签python,pandas和dataframe的最小,最大和平均viewcount。
我已经建立了一个单独的数据库,其中first_tag是python,pandas和dataframe,但我不知道如何获取每个标签的最小最大值和平均观看次数。
答案 0 :(得分:4)
使用groupby
后跟describe
df.groupby('first_tag').viewcount.describe()
Out[89]:
count mean std min 25% 50% 75% max
first_tag
Excel 1.0 83.0 NaN 83.0 83.0 83.0 83.0 83.0
pandas 2.0 87.0 0.0 87.0 87.0 87.0 87.0 87.0
python 1.0 78.0 NaN 78.0 78.0 78.0 78.0 78.0