我的数据框如下:
name | salary
Tom | 10200
Kate |
Mi | 32311
关于薪水和round_salary,kate的值为'',我将其替换为'',因此它在单元格中什么都没有显示。
问题:
我想在将薪水四舍五入到最接近的10,000的基础上创建一个新的薪水列。
结果如下所示
name | salary | round_salary
Tom | 10200 | 10000
Kate | |
Mi | 32311 | 30000
我的代码如下所示:
def round_income(salary):
if '' in salary:
return ''
else:
return salary.round(decimals = -4)
income.apply(lambda x: round_salary(x['income']), axis=1)
输出错误为:
KeyError: ('salary', 'occurred at index 0')
有人知道如何解决吗?我发现map或apply函数可以解决它,谢谢任何人的事先帮助。 〜
答案 0 :(得分:1)
如果没有缺失值但非数字为空值的解决方案:
income['salary'] = (pd.to_numeric(income['salary'], errors='coerce')
.round(decimals = -4)
.fillna(''))
print (income)
name salary
0 Tom 10000
1 Kate
2 Mi 20000
缺少值的解决方案-salary
列中的所有数据均为数字:
income['salary'] = income['salary'].round(decimals = -4).astype('Int64')
print (income)
name salary
0 Tom 10000
1 Kate NaN
2 Mi 20000