Python Pandas Group由相同的值组成并替换为均值

时间:2015-09-29 11:28:42

标签: python pandas

我在Python Pandas中有一个只有两列的数据框。第一个重复值如下:

   A    B
   apple   0.5
   apple   0.8
   apple   1.4
   orange   0.4
   orange   1.1
   melon   0.3
   melon   0.1
   melon   0.9
   melon   1.2

我想要做的是创建一个新数据框,其中包含第一个数据框中每个值的平均值。例如:

   A   B
   apple   0.9
   orange   0.75
   melon   0.625

该文件大约有2.5万行,我无法在Excel中执行此操作。任何想法如何在熊猫中完成?

1 个答案:

答案 0 :(得分:0)

df成为您的数据框,您可以只用'{'groupby获得平均值:

g = df.groupby('A').mean()

返回:

       B
A       
1  0.900
2  0.750
3  0.625

编辑:如果你不熟悉熊猫并且你有一个外部文件,你可以用以下方法导入:

df = pandas.read_csv(yourfile)

EDIT2:

g = df.groupby('A').mean()

也适用于您编辑的水果数据框:

            B
A            
apple   0.900
melon   0.625
orange  0.750