实际上,我是python的新手,但pandas数据框面临一些问题。我想找出带有正标签的列的平均值。我有三列x1,x2和label。我想找出带有标签“正”的x1的平均值。我使用了一个像这样的熊猫数据框。有人可以帮我弄这个吗。
x1 x2 label
0 5 2 positive
1 6 1 positive
2 7 3 positive
3 7 5 positive
4 8 10 positive
5 9 3 positive
6 0 4 negative
7 1 8 negative
8 2 6 negative
9 4 10 negative
10 5 9 negative
11 6 11 negative
答案 0 :(得分:2)
使用df.loc[]
过滤后,您可能要查看df['label'].eq('positive')
:
df.loc[df['label'].eq('positive'),'x1'].mean()
答案 1 :(得分:1)
您可以使用boolean indexing进行以下操作:
df.loc[df['label'] == 'positive', 'x1'].mean()
或者
df.loc[df['label'].isin(['positive']), 'x1'].mean()
对于正确的群集,布尔索引数组为True
。 x1
只是用于计算平均值的列的名称。