Question

我想计算多个行的平均值，这些行具有匹配的单个值并将其存储在另一个csv文件中。给定的数据是：

ID   salary days_of_work ...
1    2000   3            ...
1    1890   2            ...
1    2109   4            ...
2     .
2     .
2     .
2
3
3
...

然后在另一个文件中获取每个ID，一行包含其他列的数据平均值，如下所示：

ID   salary     days_of_work ...
1    1999.6667  3 ...
2    ...
3    ...
.
.
.

更新

我尝试这样做但是对于一个有utc_time而不是ID

的文件

import pandas as pd


keep_col = ['utc_time','temperature','pressure','humidity','wind_direction','wind_speed/kph']
pd.read_csv('Gridpoints.csv', names=keep_col).to_csv("GridPoints/test.csv", index=False)



f=pd.read_csv("Gridpoints"+".csv")
df = f[keep_col]

df.groupby(['utc_time']).mean()

df.to_csv("GridPoints/test.csv", index=False)

所以我首先要做的是删除列，然后在获得的数据帧上，我想为utc_time列执行此操作，但它不执行任何操作

Answer 1

首先，您需要按ID进行分组，然后计算平均值。

import pandas as pd

df = pd.read_csv('Book1.csv')

df1 = df.groupby(['ID'], as_index= False)[['Salary', 'days']].mean()
print(df1)

ID       Salary  days
1  1999.666667   3.0

如何计算与给定id匹配的多行之间的平均值

1 个答案: