根据熊猫数据框中的标签计算列的平均值

时间:2019-09-21 17:20:13

标签: pandas dataframe

实际上,我是python的新手,但pandas数据框面临一些问题。我想找出带有正标签的列的平均值。我有三列x1,x2和label。我想找出带有标签“正”的x1的平均值。我使用了一个像这样的熊猫数据框。有人可以帮我弄这个吗。

        x1  x2     label
 0       5   2  positive
 1       6   1  positive
 2       7   3  positive
 3       7   5  positive
 4       8  10  positive
 5       9   3  positive
 6       0   4  negative
 7       1   8  negative
 8       2   6  negative
 9       4  10  negative
 10      5   9  negative
 11      6  11  negative

2 个答案:

答案 0 :(得分:2)

使用df.loc[]过滤后,您可能要查看df['label'].eq('positive')

df.loc[df['label'].eq('positive'),'x1'].mean()

答案 1 :(得分:1)

您可以使用boolean indexing进行以下操作:

df.loc[df['label'] == 'positive', 'x1'].mean()

或者

df.loc[df['label'].isin(['positive']), 'x1'].mean()

对于正确的群集,布尔索引数组为Truex1只是用于计算平均值的列的名称。