Question

我在Python Pandas中有一个只有两列的数据框。第一个重复值如下：

   A    B
   apple   0.5
   apple   0.8
   apple   1.4
   orange   0.4
   orange   1.1
   melon   0.3
   melon   0.1
   melon   0.9
   melon   1.2

我想要做的是创建一个新数据框，其中包含第一个数据框中每个值的平均值。例如：

   A   B
   apple   0.9
   orange   0.75
   melon   0.625

该文件大约有2.5万行，我无法在Excel中执行此操作。任何想法如何在熊猫中完成？

Answer 1

让df成为您的数据框，您可以只用'{'groupby获得平均值：

g = df.groupby('A').mean()

返回：

编辑：如果你不熟悉熊猫并且你有一个外部文件，你可以用以下方法导入：

df = pandas.read_csv(yourfile)

EDIT2：

g = df.groupby('A').mean()

也适用于您编辑的水果数据框：

            B
A            
apple   0.900
melon   0.625
orange  0.750