Question

我想在Pandas 23.0中使用dataframe进行操作，但我找不到最好的方法。

我从CSV中获取带有时间和值的ID，我打算计算每行的平均值（mean ()）。

Example:
id time value
1 22:10:01 10
2 22:10:02 20
3 22:10:03 30
2 22:10:04 40
1 22:10:05 50

It would be something like this:
id time value mean
1 22:10:01 10 10
2 22:10:02 20 20
3 22:10:03 30 30
2 22:10:04 40 30 ((40 + 20) / 2)
1 22:10:05 50 30 ((50 + 10) / 2)

考虑到第一种方法就是价值本身。

我已经使用辅助字典找到了解决方案：

dat = pd.read_csv ('file.csv')
dicc = {}

for row in dat.itertuples ():
    ids = row [1]
    values = row [3]
    timestamps = row [2]

    if ids in dicc
        dicc [ids]['id'].append(ids)
        dicc [ids]['value'].append(values)
        dicc [ids]['mean'].append((dicc[ids]['mean'][- 1]+values)/2)
    else:
        dicc [ids] = {
            'sensor_id': [ids],
            'timestamp': [timestamps],
            'mean': [values]

df2 = pd.DataFrame.from_dict(data=dicc)
df2.to_csv('file2.csv')

基本上我所做的就是填写字典，知道id是否已经出现。

如果尝试使用mean列创建一个新的df以测试调整：

last=len(datos.columns)
df=pd.DataFrame(data=dat, columns=dat.keys()) 
df.insert(loc=last, column='mean', value=None)

但我找不到在数据框中执行该过程的方法

Answer 1

您可以使用predefined mean function

df.mean(axis=1)

在pandas中按行与数据帧一起操作

1 个答案: