我在Python Pandas中有一个只有两列的数据框。第一个重复值如下:
A B
apple 0.5
apple 0.8
apple 1.4
orange 0.4
orange 1.1
melon 0.3
melon 0.1
melon 0.9
melon 1.2
我想要做的是创建一个新数据框,其中包含第一个数据框中每个值的平均值。例如:
A B
apple 0.9
orange 0.75
melon 0.625
该文件大约有2.5万行,我无法在Excel中执行此操作。任何想法如何在熊猫中完成?
答案 0 :(得分:0)
让df
成为您的数据框,您可以只用'{'groupby
获得平均值:
g = df.groupby('A').mean()
返回:
B
A
1 0.900
2 0.750
3 0.625
编辑:如果你不熟悉熊猫并且你有一个外部文件,你可以用以下方法导入:
df = pandas.read_csv(yourfile)
EDIT2:
g = df.groupby('A').mean()
也适用于您编辑的水果数据框:
B
A
apple 0.900
melon 0.625
orange 0.750