在python中分组和除法值

时间:2019-08-08 23:24:31

标签: python pandas csv dataframe

我要创建具有相同“ NROCUENTA”记录的记录,创建一列,其中第一个“ SALDO”的结果除以该组中的记录数

import pandas as pd
import csv, sys
try:
 file_encoding = 'utf8'      
 input_fd = open('DAT_210.del', encoding=file_encoding)

 df = pd.read_csv(input_fd, sep = ' ', quotechar='"', error_bad_lines=False)
 result=df.groupby('NROCUENTA').apply(
    lambda x: ................................
 )
except csv.Error as e:
        sys.exit('file {}, line {}: {}'.format("datahist.del", reader.line_num, e))

resutl2=result.to_csv('result001.csv',mode = 'w', index=False )

SALDO = FIRST(SALDO)/ COUNT(NROCUENTA)

数据

 "NROCUENTA" "SALDO" 
"210-1-388" 159.20 
"210-1-388" 159.20 

"210-1-1219" 0.93 

"210-1-11657" 0.06 
"210-1-11657" 0.06 
"210-1-11657" 0.06 

结果

"210-1-388" 79.6 
"210-1-388" 79.6 

"210-1-1219" 0.93 

"210-1-11657" 0.02 
"210-1-11657" 0.02
"210-1-11657" 0.02

尝试

我正在尝试使用dfply库,但是它给我带来了错误,我决定使用熊猫来做

1 个答案:

答案 0 :(得分:0)

IIUC,您需要transformcount并将其除以SALDO列。我将结果分配给列AVG_SALDO

df['AVG_SALDO'] = df['SALDO'] / df.groupby('NROCUENTA').SALDO.transform('count')

Out[1112]:
     NROCUENTA   SALDO  AVG_SALDO
0    210-1-388  159.20      79.60
1    210-1-388  159.20      79.60
2   210-1-1219    0.93       0.93
3  210-1-11657    0.06       0.02
4  210-1-11657    0.06       0.02
5  210-1-11657    0.06       0.02